Commit dc77f5d24e4a52de959cdcf98444e36f66b89dd5

Authored by bigot benjamin
1 parent 7a7891b7b4
Exists in master

readme to md format

Showing 1 changed file with 66 additions and 0 deletions Side-by-side Diff

  1 +11_10_2013
  2 +
  3 +
  4 +#
  5 +
  6 +scripts dans le repertoire Scripts/
  7 +
  8 +# ********************* #
  9 +
  10 +- /labo/Tools/kaldi-trunk
  11 + executables kaldi sur le serveur
  12 + le PATH est mis a jour de maniere a taper sur ces executables
  13 +
  14 +- Scripts
  15 + contient l'ensemble de scripts necessaires aux apprentissages et decodages
  16 + -- 00_init_path_LIA.sh <path to experiment>
  17 + definit les path vers les executables kaldi, les scripts et les variable de l'experience
  18 + les chemin vers les expe kaldi n'ont plus besoin d'etre defini par la suite
  19 +
  20 + -- 01_prepare_TRAIN_data.sh <EXPE_DIR> <TRS> <WAV>
  21 + permet de preparer les donnees pour l'apprentissage des modeles acoustiques avec
  22 + les tours de parole et l'extraction des parametres acoustiques
  23 + les donnees sont placees dans les repertoire AC_DATA, MFCC et MFCC/log
  24 +
  25 + -- 01_prepare_TEST_data.sh <EXPE_DIR> <TRS> <WAV>
  26 + prepare les donnees du test dans le repertoire EXPE_DIR/TEST
  27 + prepare les segmentations et les parametre acoustiques pour le decodage
  28 +
  29 + -- 02_prepare_lexique.sh <EXPE_DIR>
  30 + plusieurs fichiers sont necessaires avant la compilation en fst du modele de langue
  31 + il faut notamment preparer les topologies de phonemes non silence et silence
  32 +
  33 + -- 03_compile_LM.sh <EXPE_DIR>
  34 + compilation en fst du modele de langue
  35 + il faut definir le arpa dans le variable en debut de script
  36 +
  37 + -- .... to be continued
  38 +
  39 + /_ => utils
  40 + /_ => steps
  41 + /_ => LIA_utils
  42 + scripts de mise en forme des fichiers trs vers le format kaldi
  43 +
  44 +- LM_DATABASE
  45 + contient le modele de language arpa decompresse, et le lexique format speeral ou kaldi
  46 + une variable d'envronnement permet de pointer vers le arpa
  47 +
  48 +- EXPE_DIR/
  49 + ce repertoire est cree lors de l'execution de Scripts/00_init_path.sh <path to expe>
  50 + /_ => ACOUSTIC_MODEL
  51 + modeles acoustiques compiles, les donnees necessaires, les graphes et les expe de decodage
  52 + /_ => LANGUAGE_MODEL
  53 + modele linguistique compile sous forme de fst
  54 + /_ => AC_DATA
  55 + donnees de preparation des parametres acoustiques
  56 + /_ => LM_DATA
  57 + donnees de prepa du fst
  58 + /_ => TEST
  59 + /_ => AC_DATA
  60 + /_ => LM_DATA
  61 +
  62 +
  63 +# ********************* #
  64 +
  65 +pas de parallélisation pour le moment (pas nécessaire d'initialisation la variable $cmd)