11_10_2013 la liste des scripts a lancer sont des le repertoire Scripts/ # ********************* # ** /labo/Tools/kaldi-trunk executables kaldi sur le serveur le PATH est mis a jour de maniere a taper sur ces executables ** Scripts contient l'ensemble de scripts necessaires aux apprentissages et decodages * 00_init_path_LIA.sh definit les path vers les executables kaldi, les scripts et les variable de l'experience les chemin vers les expe kaldi n'ont plus besoin d'etre defini par la suite * 01_prepare_TRAIN_data.sh permet de preparer les donnees pour l'apprentissage des modeles acoustiques avec les tours de parole et l'extraction des parametres acoustiques les donnees sont placees dans les repertoire AC_DATA, MFCC et MFCC/log * 01_prepare_TEST_data.sh prepare les donnees du test dans le repertoire EXPE_DIR/TEST prepare les segmentations et les parametre acoustiques pour le decodage * 02_prepare_lexique.sh plusieurs fichiers sont necessaires avant la compilation en fst du modele de langue il faut notamment preparer les topologies de phonemes non silence et silence * 03_compile_LM.sh compilation en fst du modele de langue il faut definir le arpa dans le variable en debut de script * .... to be continued /_ => utils /_ => steps /_ => LIA_utils scripts de mise en forme des fichiers trs vers le format kaldi ** LM_DATABASE contient le modele de language arpa decompresse, et le lexique format speeral ou kaldi une variable d'envronnement permet de pointer vers le arpa ** EXPE_DIR/ ce repertoire est cree lors de l'execution de Scripts/00_init_path.sh /_ => ACOUSTIC_MODEL modeles acoustiques compiles, les donnees necessaires, les graphes et les expe de decodage /_ => LANGUAGE_MODEL modele linguistique compile sous forme de fst /_ => AC_DATA donnees de preparation des parametres acoustiques /_ => LM_DATA donnees de prepa du fst /_ => TEST /_ => AC_DATA /_ => LM_DATA # ********************* # pas de parallélisation pour le moment (pas nécessaire d'initialisation la variable $cmd)