README 2.14 KB
11_10_2013

la liste des scripts a lancer sont des le repertoire Scripts/



# ********************* #

** /labo/Tools/kaldi-trunk
	executables kaldi sur le serveur
	le PATH est mis a jour de maniere a taper sur ces executables

** Scripts
	contient l'ensemble de scripts necessaires aux apprentissages et decodages
	* 00_init_path_LIA.sh <path to experiment>
		definit les path vers les executables kaldi, les scripts et les variable de l'experience
		les chemin vers les expe kaldi n'ont plus besoin d'etre defini par la suite

	* 01_prepare_TRAIN_data.sh <EXPE_DIR> <TRS> <WAV>
		permet de preparer les donnees pour l'apprentissage des modeles acoustiques avec
		les tours de parole et l'extraction des parametres acoustiques
		les donnees sont placees dans les repertoire AC_DATA, MFCC et MFCC/log 
	
	* 01_prepare_TEST_data.sh <EXPE_DIR> <TRS> <WAV>
		prepare les donnees du test dans le repertoire EXPE_DIR/TEST
		prepare les segmentations et les parametre acoustiques pour le decodage	

	* 02_prepare_lexique.sh <EXPE_DIR>
		plusieurs fichiers sont necessaires avant la compilation en fst du modele de langue
		il faut notamment preparer les topologies de phonemes non silence et silence

	* 03_compile_LM.sh <EXPE_DIR>
		compilation en fst du modele de langue
		il faut definir le arpa dans le variable en debut de script
	
	* .... to be continued	

	/_ => utils
	/_ => steps
	/_ => LIA_utils
		scripts de mise en forme des fichiers trs vers le format kaldi

** LM_DATABASE
	contient le modele de language arpa decompresse, et le lexique format speeral ou kaldi 
	une variable d'envronnement permet de pointer vers le arpa

** EXPE_DIR/
	ce repertoire est cree lors de l'execution de Scripts/00_init_path.sh <path to expe>
	/_ => ACOUSTIC_MODEL
		modeles acoustiques compiles, les donnees necessaires, les graphes et les expe de decodage
	/_ => LANGUAGE_MODEL
		modele linguistique compile sous forme de fst
	/_ => AC_DATA
		donnees de preparation des parametres acoustiques
	/_ => LM_DATA
		donnees de prepa du fst
	/_ => TEST
		/_ => AC_DATA
		/_ => LM_DATA


# ********************* #

pas de parallélisation pour le moment (pas nécessaire d'initialisation la variable $cmd)