b0VIM 7.3|ü¶Lm@ qjeffjeff-rey~jeff/Taf/otmedia/tools/lia_ltbox/lia_ne_v2.2/README.txt 3210#"! Utpÿ6advb6òãâ˜yG©¨“’vQ+*Ì † > = ä ã › S R þ ¹ ¸ ª © Z Y % $ È Ç · ¶ ] \ & % é è § ˜ 7 Ú™—•…eba Frederic.Bechet@lif.univ-mrs.frFrederic Bechet ----------------------------------------------------------------UTILISER LA COMMANDE 'iconv -t ISO-8859-1 -f UTF-8' SI VOUS VOULEZ TRAITER DU TEXTE EN UTF-8L'ENCODAGE DES CARACTERES DANS TOUT TEXTE (OU CTM OU STM) DOIT IMPERATIVEMENT ETRE EN ISO-8859-1ATTENTION !!!!----------------------------------------------------------------Attention, le post-processing ESTER n'est pas applique ici.ou encore : cat sample.txt | ./script/lia_ne_tagg_txt Je vais à Marseille voir l' Olympique de Marseille . qui affichera :echo "Je vais à Marseille voir l'Olympique de Marseille." | $LIA_NE/script/lia_ne_tagg_txtOn peut aussi tagger du texte simple, par exemple :./script/lia_ne_tagg_ctm 20071220_1900_1920_inter.ctm popo.ctm-ne -post -nocapPar exemple :L'option -nocap permet de prendre en entree un texte sans majuscule.L'option -post permet d'appliquer les regles de postprocessing specifiques a ESTER.script/lia_ne_tagg_stm [-post] [-nocap]script/lia_ne_tagg_ctm [-post] [-nocap]Et enfin, les scripts suivants permettent de traiter des fichiers de reco (CTM et STM) :Ca compile les sources et produits les fichiers de donnees necessaires.il suffit d'aller dans le repertoire LIA_NE puis de lancer 'make all'Apres avoir installe les outils lia_tagg et CRF++ (voir les fichiers README de chacun d'eux),export LIA_NE=/home/tools/lia_ne_v2.2export LIA_TAGG=/home/tools/lia_taggexport LIA_TAGG_LANG=frenchPar exemple en bash:Ensuite, il faut definir les variables d'environnement suivante (bien sur la ou les packages sont installes !!) :(et le convertisseur de caractere 'iconv')- CRF++ (dispo a : http://crfpp.sourceforge.net/)- lia_tagg (dispo sur ma page)Alors, tout d'abord il faut les outils suivant (en plus de LIA_NE v2.2) :# FRED 07/2010# LIA_NE v2.2