Blame view

tools/lia_ltbox/lia_phon/src/libgram/compile_pmc.c 4.41 KB
e6be5137b   Jean-François Rey   reinitialized pro...
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
  /*
      --------------------------------------------------------
      LIA_PHON : Un systeme complet de phonetisation de textes
      --------------------------------------------------------
  
      Copyright (C) 2001 FREDERIC BECHET
  
      ..................................................................
  
      This file is part of LIA_PHON
  
      LIA_PHON is free software; you can redistribute it and/or modify
      it under the terms of the GNU General Public License as published by
      the Free Software Foundation; either version 2 of the License, or
      (at your option) any later version.
  
      This program is distributed in the hope that it will be useful,
      but WITHOUT ANY WARRANTY; without even the implied warranty of
      MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
      GNU General Public License for more details.
  
      You should have received a copy of the GNU General Public License
      along with this program; if not, write to the Free Software
      Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
      ..................................................................
  
      For any publication related to scientific work using LIA_PHON,
      the following reference paper must be mentioned in the bibliography: 
          
      Bechet F., 2001, "LIA_PHON - Un systeme complet de phonetisation
      de textes", revue Traitement Automatique des Langues (T.A.L.)
      volume 42, numero 1/2001, edition Hermes
      ..................................................................
                                
      Contact :
                FREDERIC BECHET - LIA - UNIVERSITE D'AVIGNON
                AGROPARC BP1228 84911  AVIGNON  CEDEX 09  FRANCE
                frederic.bechet@lia.univ-avignon.fr
      ..................................................................
  */
  /*  Compile un modele Proba Mot sachant la Classe (PMC)
      Il faut en entree :
       - un lexique (compile sirocco) pour les mots
       - un lexique (compile sirocco) pour les classes
       - un fichier texte au format :
  	mot\tclasse\tcompte\tlemme
  
      Cela produit 3 fichiers en sortie :
       - .pmc_des : descripteur
       - .pmc_tab : tableau des mots
       - .pmc_zon : les classes et les probas  */
  
  /*  FRED 0399  */ /*  MODIF - FRED - Rajout des lemmes 0699  */
  
  #include <stdio.h>
  #include <stdlib.h>
  #include <string.h>
  #include <strings.h>
  #include <libgram.h>
  
  int main(int argc,char **argv)
  {
  ty_lexique pt_lexique_mot,pt_lexique_classe;
  int si_log_e,si_lemme;
  ty_pmc pt_pmc;
  
  if (argc<2)
   {
   fprintf(stderr,"Syntaxe : %s [-h] <lexi mot> <lexi classe> <fich compte> <lemme/no_lemme>\
  <log_e/log_10> <nom modele> 
  ",argv[0]);
   exit(0);
   }
  
  if ((argc<6)||(!strcmp(argv[1],"-h")))
   {
   fprintf(stderr,"Syntaxe : %s [-h] <lexi mot> <lexi classe> <fich compte> <lemme/no_lemme> \
   <log_e/log_10> <nom modele>
  \
   \t ce programme permet de compiler un modele Proba Mot sachant la Classe (PMC).
  \
   \t Les arguments d'entree sont les suivants :
  \
   \t  -h : affiche ce message
  \
   \t  lexi mot : lexique (compile sirocco) pour les mots
  \
   \t  lexi classe : lexique (compile sirocco) pour les classes
  \
   \t  fich compte : fichier texte au format (sur chaque ligne ) : mot classe compte 
  \
   \t                obtenu, par exemple avec 'produit_compte_pmc'
  \
   \t  lemme ou no_lemme : permet de specifier si on veut obtenir les lemmes stockes dans le 
  \
   \t                      fichier de compte lors de l'acces a une proba P(M/C) 
  \
   \t  log_e ou log_10 : permet d'avoir les probas, soit en log_e soit en log_10
  \
   \t  nom modele : nom generique du fichier de stockage du modele
  \
   \t Ce programme produit en sortie 3 fichiers :
  \
   \t  <nom modele>.pmc_des : descripteur
  \
   \t  <nom modele>.pmc_tab : tableau des mots
  \
   \t  <nom modele>.pmc_zon : les classes et les probas
  
  ",argv[0]);
   exit(0);
   }
  
  fprintf(stderr,"Chargement des lexiques mot et classe -> ");
  pt_lexique_mot=ChargeLexique(argv[1]);
  pt_lexique_classe=ChargeLexique(argv[2]);
  fprintf(stderr,"Termine
  ");
  
  if (!strcmp(argv[4],"lemme")) si_lemme=1; else si_lemme=0;
  
  if (!strcmp(argv[5],"log_e")) si_log_e=1; else si_log_e=0;
  
  fprintf(stderr,"Compilation du modele PMC
  ");
  pt_pmc=compile_modele_pmc(argv[3],pt_lexique_mot,pt_lexique_classe,si_log_e,si_lemme);
  fprintf(stderr,"Termine
  ");
  
  fprintf(stderr,"Sauvegarde du modele PMC -> ");
  sauve_pmc(argv[6],pt_pmc);
  fprintf(stderr,"Termine
  ");
  
  delete_lexique(pt_lexique_mot);
  delete_lexique(pt_lexique_classe);
  delete_pmc(pt_pmc);
  
  fprintf(stderr,"Termine
  ");
  
  exit(0); 
  }