Download zip Select Archive Format
Name Last Update history
File dir LIA_kaldiUtils Loading commit data...
File dir Scripts Loading commit data...
File dir conf Loading commit data...
File txt README.md Loading commit data...

README.md

11_10_2013

#

scripts dans le repertoire Scripts/

*********************

  • /labo/Tools/kaldi-trunk executables kaldi sur le serveur le PATH est mis a jour de maniere a taper sur ces executables

  • Scripts contient l'ensemble de scripts necessaires aux apprentissages et decodages

    • 00_init_path_LIA.sh definit les path vers les executables kaldi, les scripts et les variable de l'experience les chemin vers les expe kaldi n'ont plus besoin d'etre defini par la suite
    • 01_prepare_TRAIN_data.sh permet de preparer les donnees pour l'apprentissage des modeles acoustiques avec les tours de parole et l'extraction des parametres acoustiques les donnees sont placees dans les repertoire AC_DATA, MFCC et MFCC/log
    • 01_prepare_TEST_data.sh prepare les donnees du test dans le repertoire EXPE_DIR/TEST prepare les segmentations et les parametre acoustiques pour le decodage
    • 02_prepare_lexique.sh plusieurs fichiers sont necessaires avant la compilation en fst du modele de langue il faut notamment preparer les topologies de phonemes non silence et silence
    • 03_compile_LM.sh compilation en fst du modele de langue il faut definir le arpa dans le variable en debut de script
    • .... to be continued

    /_ => utils /_ => steps /_ => LIA_utils scripts de mise en forme des fichiers trs vers le format kaldi

  • LM_DATABASE contient le modele de language arpa decompresse, et le lexique format speeral ou kaldi une variable d'envronnement permet de pointer vers le arpa

  • EXPE_DIR/ ce repertoire est cree lors de l'execution de Scripts/00_init_path.sh /_ => ACOUSTIC_MODEL modeles acoustiques compiles, les donnees necessaires, les graphes et les expe de decodage /_ => LANGUAGE_MODEL modele linguistique compile sous forme de fst /_ => AC_DATA donnees de preparation des parametres acoustiques /_ => LM_DATA donnees de prepa du fst /_ => TEST /_ => AC_DATA /_ => LM_DATA

*********************

pas de parallélisation pour le moment (pas nécessaire d'initialisation la variable $cmd)