11_10_2013
la liste des scripts a lancer sont des le repertoire Scripts/
# ********************* #
** /labo/Tools/kaldi-trunk
executables kaldi sur le serveur
le PATH est mis a jour de maniere a taper sur ces executables
** Scripts
contient l'ensemble de scripts necessaires aux apprentissages et decodages
* 00_init_path_LIA.sh <path to experiment>
definit les path vers les executables kaldi, les scripts et les variable de l'experience
les chemin vers les expe kaldi n'ont plus besoin d'etre defini par la suite
* 01_prepare_TRAIN_data.sh <EXPE_DIR> <TRS> <WAV>
permet de preparer les donnees pour l'apprentissage des modeles acoustiques avec
les tours de parole et l'extraction des parametres acoustiques
les donnees sont placees dans les repertoire AC_DATA, MFCC et MFCC/log
* 01_prepare_TEST_data.sh <EXPE_DIR> <TRS> <WAV>
prepare les donnees du test dans le repertoire EXPE_DIR/TEST
prepare les segmentations et les parametre acoustiques pour le decodage
* 02_prepare_lexique.sh <EXPE_DIR>
plusieurs fichiers sont necessaires avant la compilation en fst du modele de langue
il faut notamment preparer les topologies de phonemes non silence et silence
* 03_compile_LM.sh <EXPE_DIR>
compilation en fst du modele de langue
il faut definir le arpa dans le variable en debut de script
* .... to be continued
/_ => utils
/_ => steps
/_ => LIA_utils
scripts de mise en forme des fichiers trs vers le format kaldi
** LM_DATABASE
contient le modele de language arpa decompresse, et le lexique format speeral ou kaldi
une variable d'envronnement permet de pointer vers le arpa
** EXPE_DIR/
ce repertoire est cree lors de l'execution de Scripts/00_init_path.sh <path to expe>
/_ => ACOUSTIC_MODEL
modeles acoustiques compiles, les donnees necessaires, les graphes et les expe de decodage
/_ => LANGUAGE_MODEL
modele linguistique compile sous forme de fst
/_ => AC_DATA
donnees de preparation des parametres acoustiques
/_ => LM_DATA
donnees de prepa du fst
/_ => TEST
/_ => AC_DATA
/_ => LM_DATA
# ********************* #
pas de parallélisation pour le moment (pas nécessaire d'initialisation la variable $cmd)