Commit dc77f5d24e4a52de959cdcf98444e36f66b89dd5
1 parent
7a7891b7b4
Exists in
master
readme to md format
Showing 1 changed file with 66 additions and 0 deletions Side-by-side Diff
README.md
1 | +11_10_2013 | |
2 | + | |
3 | + | |
4 | +# | |
5 | + | |
6 | +scripts dans le repertoire Scripts/ | |
7 | + | |
8 | +# ********************* # | |
9 | + | |
10 | +- /labo/Tools/kaldi-trunk | |
11 | + executables kaldi sur le serveur | |
12 | + le PATH est mis a jour de maniere a taper sur ces executables | |
13 | + | |
14 | +- Scripts | |
15 | + contient l'ensemble de scripts necessaires aux apprentissages et decodages | |
16 | + -- 00_init_path_LIA.sh <path to experiment> | |
17 | + definit les path vers les executables kaldi, les scripts et les variable de l'experience | |
18 | + les chemin vers les expe kaldi n'ont plus besoin d'etre defini par la suite | |
19 | + | |
20 | + -- 01_prepare_TRAIN_data.sh <EXPE_DIR> <TRS> <WAV> | |
21 | + permet de preparer les donnees pour l'apprentissage des modeles acoustiques avec | |
22 | + les tours de parole et l'extraction des parametres acoustiques | |
23 | + les donnees sont placees dans les repertoire AC_DATA, MFCC et MFCC/log | |
24 | + | |
25 | + -- 01_prepare_TEST_data.sh <EXPE_DIR> <TRS> <WAV> | |
26 | + prepare les donnees du test dans le repertoire EXPE_DIR/TEST | |
27 | + prepare les segmentations et les parametre acoustiques pour le decodage | |
28 | + | |
29 | + -- 02_prepare_lexique.sh <EXPE_DIR> | |
30 | + plusieurs fichiers sont necessaires avant la compilation en fst du modele de langue | |
31 | + il faut notamment preparer les topologies de phonemes non silence et silence | |
32 | + | |
33 | + -- 03_compile_LM.sh <EXPE_DIR> | |
34 | + compilation en fst du modele de langue | |
35 | + il faut definir le arpa dans le variable en debut de script | |
36 | + | |
37 | + -- .... to be continued | |
38 | + | |
39 | + /_ => utils | |
40 | + /_ => steps | |
41 | + /_ => LIA_utils | |
42 | + scripts de mise en forme des fichiers trs vers le format kaldi | |
43 | + | |
44 | +- LM_DATABASE | |
45 | + contient le modele de language arpa decompresse, et le lexique format speeral ou kaldi | |
46 | + une variable d'envronnement permet de pointer vers le arpa | |
47 | + | |
48 | +- EXPE_DIR/ | |
49 | + ce repertoire est cree lors de l'execution de Scripts/00_init_path.sh <path to expe> | |
50 | + /_ => ACOUSTIC_MODEL | |
51 | + modeles acoustiques compiles, les donnees necessaires, les graphes et les expe de decodage | |
52 | + /_ => LANGUAGE_MODEL | |
53 | + modele linguistique compile sous forme de fst | |
54 | + /_ => AC_DATA | |
55 | + donnees de preparation des parametres acoustiques | |
56 | + /_ => LM_DATA | |
57 | + donnees de prepa du fst | |
58 | + /_ => TEST | |
59 | + /_ => AC_DATA | |
60 | + /_ => LM_DATA | |
61 | + | |
62 | + | |
63 | +# ********************* # | |
64 | + | |
65 | +pas de parallélisation pour le moment (pas nécessaire d'initialisation la variable $cmd) |