Blame view

README 2.14 KB
ec85f8892   bigot benjamin   first commit
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
  11_10_2013
  
  la liste des scripts a lancer sont des le repertoire Scripts/
  
  
  
  # ********************* #
  
  ** /labo/Tools/kaldi-trunk
  	executables kaldi sur le serveur
  	le PATH est mis a jour de maniere a taper sur ces executables
  
  ** Scripts
  	contient l'ensemble de scripts necessaires aux apprentissages et decodages
  	* 00_init_path_LIA.sh <path to experiment>
  		definit les path vers les executables kaldi, les scripts et les variable de l'experience
  		les chemin vers les expe kaldi n'ont plus besoin d'etre defini par la suite
  
  	* 01_prepare_TRAIN_data.sh <EXPE_DIR> <TRS> <WAV>
  		permet de preparer les donnees pour l'apprentissage des modeles acoustiques avec
  		les tours de parole et l'extraction des parametres acoustiques
  		les donnees sont placees dans les repertoire AC_DATA, MFCC et MFCC/log 
  	
  	* 01_prepare_TEST_data.sh <EXPE_DIR> <TRS> <WAV>
  		prepare les donnees du test dans le repertoire EXPE_DIR/TEST
  		prepare les segmentations et les parametre acoustiques pour le decodage	
  
  	* 02_prepare_lexique.sh <EXPE_DIR>
  		plusieurs fichiers sont necessaires avant la compilation en fst du modele de langue
  		il faut notamment preparer les topologies de phonemes non silence et silence
  
  	* 03_compile_LM.sh <EXPE_DIR>
  		compilation en fst du modele de langue
  		il faut definir le arpa dans le variable en debut de script
  	
  	* .... to be continued	
  
  	/_ => utils
  	/_ => steps
  	/_ => LIA_utils
  		scripts de mise en forme des fichiers trs vers le format kaldi
  
  ** LM_DATABASE
  	contient le modele de language arpa decompresse, et le lexique format speeral ou kaldi 
  	une variable d'envronnement permet de pointer vers le arpa
  
  ** EXPE_DIR/
  	ce repertoire est cree lors de l'execution de Scripts/00_init_path.sh <path to expe>
  	/_ => ACOUSTIC_MODEL
  		modeles acoustiques compiles, les donnees necessaires, les graphes et les expe de decodage
  	/_ => LANGUAGE_MODEL
  		modele linguistique compile sous forme de fst
  	/_ => AC_DATA
  		donnees de preparation des parametres acoustiques
  	/_ => LM_DATA
  		donnees de prepa du fst
  	/_ => TEST
  		/_ => AC_DATA
  		/_ => LM_DATA
  
  
  # ********************* #
  
  pas de parallélisation pour le moment (pas nécessaire d'initialisation la variable $cmd)