Blame view

README.md 2.12 KB
dc77f5d24   bigot benjamin   readme to md format
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
  11_10_2013
  
  
  #
  
  scripts dans le repertoire Scripts/
  
  # ********************* #
  
  - /labo/Tools/kaldi-trunk
  	executables kaldi sur le serveur
  	le PATH est mis a jour de maniere a taper sur ces executables
  
  - Scripts
  	contient l'ensemble de scripts necessaires aux apprentissages et decodages
3dbd73b29   bigot benjamin   readme to md format
16
  	-  00_init_path_LIA.sh <path to experiment>
dc77f5d24   bigot benjamin   readme to md format
17
18
  		definit les path vers les executables kaldi, les scripts et les variable de l'experience
  		les chemin vers les expe kaldi n'ont plus besoin d'etre defini par la suite
3dbd73b29   bigot benjamin   readme to md format
19
  	-  01_prepare_TRAIN_data.sh <EXPE_DIR> <TRS> <WAV>
dc77f5d24   bigot benjamin   readme to md format
20
21
22
23
  		permet de preparer les donnees pour l'apprentissage des modeles acoustiques avec
  		les tours de parole et l'extraction des parametres acoustiques
  		les donnees sont placees dans les repertoire AC_DATA, MFCC et MFCC/log 
  	
3dbd73b29   bigot benjamin   readme to md format
24
  	-  01_prepare_TEST_data.sh <EXPE_DIR> <TRS> <WAV>
dc77f5d24   bigot benjamin   readme to md format
25
26
  		prepare les donnees du test dans le repertoire EXPE_DIR/TEST
  		prepare les segmentations et les parametre acoustiques pour le decodage	
3dbd73b29   bigot benjamin   readme to md format
27
  	-  02_prepare_lexique.sh <EXPE_DIR>
dc77f5d24   bigot benjamin   readme to md format
28
29
  		plusieurs fichiers sont necessaires avant la compilation en fst du modele de langue
  		il faut notamment preparer les topologies de phonemes non silence et silence
3dbd73b29   bigot benjamin   readme to md format
30
  	-  03_compile_LM.sh <EXPE_DIR>
dc77f5d24   bigot benjamin   readme to md format
31
32
33
  		compilation en fst du modele de langue
  		il faut definir le arpa dans le variable en debut de script
  	
3dbd73b29   bigot benjamin   readme to md format
34
  	-  .... to be continued	
dc77f5d24   bigot benjamin   readme to md format
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
  
  	/_ => utils
  	/_ => steps
  	/_ => LIA_utils
  		scripts de mise en forme des fichiers trs vers le format kaldi
  
  - LM_DATABASE
  	contient le modele de language arpa decompresse, et le lexique format speeral ou kaldi 
  	une variable d'envronnement permet de pointer vers le arpa
  
  - EXPE_DIR/
  	ce repertoire est cree lors de l'execution de Scripts/00_init_path.sh <path to expe>
  	/_ => ACOUSTIC_MODEL
  		modeles acoustiques compiles, les donnees necessaires, les graphes et les expe de decodage
  	/_ => LANGUAGE_MODEL
  		modele linguistique compile sous forme de fst
  	/_ => AC_DATA
  		donnees de preparation des parametres acoustiques
  	/_ => LM_DATA
  		donnees de prepa du fst
  	/_ => TEST
  		/_ => AC_DATA
  		/_ => LM_DATA
  
  
  # ********************* #
  
  pas de parallélisation pour le moment (pas nécessaire d'initialisation la variable $cmd)