Commit dc77f5d24e4a52de959cdcf98444e36f66b89dd5

Authored by bigot benjamin
1 parent 7a7891b7b4
Exists in master

readme to md format

Showing 1 changed file with 66 additions and 0 deletions Inline Diff

File was created 1 11_10_2013
2
3
4 #
5
6 scripts dans le repertoire Scripts/
7
8 # ********************* #
9
10 - /labo/Tools/kaldi-trunk
11 executables kaldi sur le serveur
12 le PATH est mis a jour de maniere a taper sur ces executables
13
14 - Scripts
15 contient l'ensemble de scripts necessaires aux apprentissages et decodages
16 -- 00_init_path_LIA.sh <path to experiment>
17 definit les path vers les executables kaldi, les scripts et les variable de l'experience
18 les chemin vers les expe kaldi n'ont plus besoin d'etre defini par la suite
19
20 -- 01_prepare_TRAIN_data.sh <EXPE_DIR> <TRS> <WAV>
21 permet de preparer les donnees pour l'apprentissage des modeles acoustiques avec
22 les tours de parole et l'extraction des parametres acoustiques
23 les donnees sont placees dans les repertoire AC_DATA, MFCC et MFCC/log
24
25 -- 01_prepare_TEST_data.sh <EXPE_DIR> <TRS> <WAV>
26 prepare les donnees du test dans le repertoire EXPE_DIR/TEST
27 prepare les segmentations et les parametre acoustiques pour le decodage
28
29 -- 02_prepare_lexique.sh <EXPE_DIR>
30 plusieurs fichiers sont necessaires avant la compilation en fst du modele de langue
31 il faut notamment preparer les topologies de phonemes non silence et silence
32
33 -- 03_compile_LM.sh <EXPE_DIR>
34 compilation en fst du modele de langue
35 il faut definir le arpa dans le variable en debut de script
36
37 -- .... to be continued
38
39 /_ => utils
40 /_ => steps
41 /_ => LIA_utils
42 scripts de mise en forme des fichiers trs vers le format kaldi
43
44 - LM_DATABASE
45 contient le modele de language arpa decompresse, et le lexique format speeral ou kaldi
46 une variable d'envronnement permet de pointer vers le arpa
47
48 - EXPE_DIR/
49 ce repertoire est cree lors de l'execution de Scripts/00_init_path.sh <path to expe>
50 /_ => ACOUSTIC_MODEL
51 modeles acoustiques compiles, les donnees necessaires, les graphes et les expe de decodage
52 /_ => LANGUAGE_MODEL
53 modele linguistique compile sous forme de fst
54 /_ => AC_DATA
55 donnees de preparation des parametres acoustiques
56 /_ => LM_DATA
57 donnees de prepa du fst
58 /_ => TEST
59 /_ => AC_DATA
60 /_ => LM_DATA
61
62
63 # ********************* #
64
65 pas de parallélisation pour le moment (pas nécessaire d'initialisation la variable $cmd)
66
67