Blame view

tools/lia_ltbox/exemple/correction.rules 4.54 KB
e6be5137b   Jean-François Rey   reinitialized pro...
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
  Raymond barre # Raymond Barre
  <s> m $CAPITAL # <s> monsieur $CAPITAL
  <UNK> # UNK
  ' s # 's
  don' t # don't
  Etats - Unis # États_Unis
  Etat - Unis # États_Unis
  Etats Unis # États_Unis
  Etat Unis # États_Unis
  Etats_Unis # États_Unis
  Etat # état
  Etats # états
  week - end # week_end
  week - ends # week_ends
  L' # l'
  </s> <s> " </s> <s> # </s> <s>
  - t - il # t_il
  - t - ils # t_ils
  t - il # t_il
  t - ils # t_ils
  - t - elle # t_elle
  - t - elles # t_elles
  t - elle # t_elle
  t - elles # t_elles
  - t - on # t_on
  t - on # t_on
  Ça # ça
  C ' # c'
  L ' # l'
  D ' # d'
  J ' # j'
  T ' # t'
  c ' # c'
  l ' # l'
  d ' # d'
  j ' # j'
  t ' # t'
  qu ' # qu'
  Ç ' # ç'
  ç ' # ç'
  n ' # n'
  N ' # n'
  s ' # s'
  S ' # s'
  $CAPITAL ' s # $CAPITAL's
  $CAPITAL ' # $CAPITAL'
  inch ' Allah # inch'Allah
  doesn ' t # doesn't
  you ' re # you're
  prud ' hommale # prud'hommale
  rhythm ' n' blues # rythm'n'blues
  rythm ' n' blues # rythm'n'blues
  p ' tit # p'tit
  p ' tits # p'tits
  Commedia dell ' Arte # Commedia_dell'Arte
  quat ' sous # quat'sous
  pattes d' eph ' # pattes_d'eph'
  ch ' timie # ch'timie
  ch ' timies # ch'timies
  ch ' timi # ch'timi
  ch ' timis # ch'timis
  drum ' n' bass # drum'n'bass
  r ' n' b # r'n'b
  km / h # kilomètre heure
  km # kilomètre
  km2 # kilomètre carré
  un h # une heure
  $NUMBER h # $NUMBER heures
  a . p . # après prolongation
  $NUMBER p . # $NUMBER pages
  I' m # I'm
  un m # un mètre
  $NUMBER m # $NUMBER mètres
  e - mails # emails
  e - mail # email
  Email # email
  Emails # emails
  émail # email
  émails # emails
  e - card # e_card
  e - cards # e_cards
  V e # cinquième
  e - commerce # e_commerce
  v . o . # v.o.
  V . O . # v.o.
  Paris X # Paris dix
  M. # monsieur
  MM. # messieurs
  Mme # madame
  Mlle # mademoiselle
  un min # une minute
  $NUMBER min # $NUMBER minutes
  Me $CAPITAL # maître $CAPITAL
  XXe # vingtième
  XIXe # dix neuvième
  XIVe # quatorzième
  XVIIIe # dix huitième
  XIIIe # treizième
  XVe # quinzième
  XXIe # vingt et unième
  XVIe # seizième
  XVIIe # dix septième
  IVe # quatrième
  Ve # cinquième
  IIIe # troisième
  À # à
  Royaume - Uni # Royaume_Uni
  éd # éditeur
  Esp # Espagne
  Fra # France
  Ire # premier
  Ier # premier
  1er # premier
  1re # premier
  1ere # première
  2e # deuxième
  3e # troisième
  4e # quatrième
  5e # cinquième
  6e # sixième
  7e # septième
  8e # huitième
  9e # neuvième
  10e # dixième
  11e # onzième
  12e # douzième
  13e # treizième
  14e # quatorzième
  15e # quinzième
  16e # seizième
  17e # dix septième
  18e # dix huitième
  19e # dix neuvième
  20e # vingtième
  25e # vingt cinquième
  30e # trentième
  32e # trente deuxième
  40e # quarantième
  50e # cinquantième
  56e # cinquante sixième
  60e # soixantième
  70e # soixante dixième
  80e # quatre vingtième
  90e # quatre vingt dixième
  100e # centième
  Ita # Italie
  m2 # mètres carrés
  kg # kilogrammes
  O' $CAPITAL # O'$CAPITAL
  Etre # être
  Bouches - du - Rhône # Bouches_du_Rhône
  france # France
  Saint - Pétersbourg # Saint_Pétersbourg
  $NUMBER ch # $NUMBER chevaux
  Noir Désir # Noir_Désir
  new - yorkaise # new_yorkaise
  new - yorkais # new_yorkais
  israelo # israélo
  Dr # docteur
  Allegre # Allègre
  Alegre # Alègre
  Roland - Garros # Roland_Garros
  Equipe # Équipe
  Coca - Cola # Coca_Cola
  Egalement # également
  Fnac # FNAC
  T - shirt # tee_shirt
  T - shirts # tee_shirts
  tee - shirt # tee_shirt
  tee - shirts # tee_shirts
  sweat - shirt # sweat_shirt
  sweat - shirts # sweat_shirts
  senat # sénat
  GB # Grande_Bretagne
  irak # Irak
  m3 # mètre cube
  pacs # PACS
  rez - de - chaussée # rez_de_chaussée
  Economie # économie
  etat # état
  Qu' # qu'
  assemblee # assemblée
  $NUMBER kW # $NUMBER kilowatts
  asp # ASP
  Douste - Blazy # Douste_Blazy
  Canal + # Canal_plus
  _la # la
  _ce_que # ce que
  World Trade Center # World_Trade_Center
  Commedia_dell'Arte # Commedia_dell'arte
  General motors # General_Motors
  + # plus
  sicav # SICAV
  europe # Europe
  Rus # Russie
  Aus # Australie
  McDonald # Mac_Donald
  MacDonald # Mac_Donald
  Gus van Sant # Gus_van_Sant
  Gus Van Sant # Gus_van_Sant
  div . g. # divers gauche
  div . g . # divers gauche
  div . gauche # divers gauche
  div . d. # divers droite
  div . d . # divers droite
  div . dr. # divers droite
  div . dr . # divers droite
  div . droite # divers droite
  le Lay # Le_Lay
  Le Lay # Le_Lay
  Aut # Autriche
  high tech # high_tech
  Qu ' # qu'
  coll . # collection
  Che Guevara # Che_Guevara
  DaimlerChrysler # Daimler Chrysler
  allemagne # Allemagne
  à priori # a_priori
  à contrario # a_contrario
  antimondialisation # anti mondialisation
  antiaméricains	#	anti américains
  antiaméricain	#	anti américain
  antisionisme	#	anti sionisme
  Perec # Pérec
  New Zealand # New_Zealand 
  Le_Mans # le_Mans
  Wal Mart # Wal_Mart
  Wal MART # Wal_Mart
  rfi # RFI
  TF_un # TF1
  TF un # TF1
  TF 1 # TF1
  tf1 # TF1
  Tf1	#	TF1
  tf 1 # TF1
  tf un # TF1
  Dans	#	dans
  KERRY	#	Kerry
  Jerome	# Jérome
  bagdad	#	Bagdad
  Edf	#	EDF