Blame view

README 2.12 KB
ec85f8892   bigot benjamin   first commit
1
  11_10_2013
ec85f8892   bigot benjamin   first commit
2

121661eb2   bigot benjamin   readme to md fomat
3
  #
ec85f8892   bigot benjamin   first commit
4

121661eb2   bigot benjamin   readme to md fomat
5
  scripts dans le repertoire Scripts/
ec85f8892   bigot benjamin   first commit
6
7
  
  # ********************* #
121661eb2   bigot benjamin   readme to md fomat
8
  - /labo/Tools/kaldi-trunk
ec85f8892   bigot benjamin   first commit
9
10
  	executables kaldi sur le serveur
  	le PATH est mis a jour de maniere a taper sur ces executables
121661eb2   bigot benjamin   readme to md fomat
11
  - Scripts
ec85f8892   bigot benjamin   first commit
12
  	contient l'ensemble de scripts necessaires aux apprentissages et decodages
121661eb2   bigot benjamin   readme to md fomat
13
  	-- 00_init_path_LIA.sh <path to experiment>
ec85f8892   bigot benjamin   first commit
14
15
  		definit les path vers les executables kaldi, les scripts et les variable de l'experience
  		les chemin vers les expe kaldi n'ont plus besoin d'etre defini par la suite
121661eb2   bigot benjamin   readme to md fomat
16
  	-- 01_prepare_TRAIN_data.sh <EXPE_DIR> <TRS> <WAV>
ec85f8892   bigot benjamin   first commit
17
18
19
20
  		permet de preparer les donnees pour l'apprentissage des modeles acoustiques avec
  		les tours de parole et l'extraction des parametres acoustiques
  		les donnees sont placees dans les repertoire AC_DATA, MFCC et MFCC/log 
  	
121661eb2   bigot benjamin   readme to md fomat
21
  	-- 01_prepare_TEST_data.sh <EXPE_DIR> <TRS> <WAV>
ec85f8892   bigot benjamin   first commit
22
23
  		prepare les donnees du test dans le repertoire EXPE_DIR/TEST
  		prepare les segmentations et les parametre acoustiques pour le decodage	
121661eb2   bigot benjamin   readme to md fomat
24
  	-- 02_prepare_lexique.sh <EXPE_DIR>
ec85f8892   bigot benjamin   first commit
25
26
  		plusieurs fichiers sont necessaires avant la compilation en fst du modele de langue
  		il faut notamment preparer les topologies de phonemes non silence et silence
121661eb2   bigot benjamin   readme to md fomat
27
  	-- 03_compile_LM.sh <EXPE_DIR>
ec85f8892   bigot benjamin   first commit
28
29
30
  		compilation en fst du modele de langue
  		il faut definir le arpa dans le variable en debut de script
  	
121661eb2   bigot benjamin   readme to md fomat
31
  	-- .... to be continued	
ec85f8892   bigot benjamin   first commit
32
33
34
35
36
  
  	/_ => utils
  	/_ => steps
  	/_ => LIA_utils
  		scripts de mise en forme des fichiers trs vers le format kaldi
121661eb2   bigot benjamin   readme to md fomat
37
  - LM_DATABASE
ec85f8892   bigot benjamin   first commit
38
39
  	contient le modele de language arpa decompresse, et le lexique format speeral ou kaldi 
  	une variable d'envronnement permet de pointer vers le arpa
121661eb2   bigot benjamin   readme to md fomat
40
  - EXPE_DIR/
ec85f8892   bigot benjamin   first commit
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
  	ce repertoire est cree lors de l'execution de Scripts/00_init_path.sh <path to expe>
  	/_ => ACOUSTIC_MODEL
  		modeles acoustiques compiles, les donnees necessaires, les graphes et les expe de decodage
  	/_ => LANGUAGE_MODEL
  		modele linguistique compile sous forme de fst
  	/_ => AC_DATA
  		donnees de preparation des parametres acoustiques
  	/_ => LM_DATA
  		donnees de prepa du fst
  	/_ => TEST
  		/_ => AC_DATA
  		/_ => LM_DATA
  
  
  # ********************* #
  
  pas de parallélisation pour le moment (pas nécessaire d'initialisation la variable $cmd)