Download zip Select Archive Format
Name Last Update history
File dir LIA_kaldiUtils Loading commit data...
File dir Scripts Loading commit data...
File dir conf Loading commit data...
File txt README Loading commit data...

README

11_10_2013


#

scripts dans le repertoire Scripts/

# ********************* #

- /labo/Tools/kaldi-trunk
	executables kaldi sur le serveur
	le PATH est mis a jour de maniere a taper sur ces executables

- Scripts
	contient l'ensemble de scripts necessaires aux apprentissages et decodages
	-- 00_init_path_LIA.sh <path to experiment>
		definit les path vers les executables kaldi, les scripts et les variable de l'experience
		les chemin vers les expe kaldi n'ont plus besoin d'etre defini par la suite

	-- 01_prepare_TRAIN_data.sh <EXPE_DIR> <TRS> <WAV>
		permet de preparer les donnees pour l'apprentissage des modeles acoustiques avec
		les tours de parole et l'extraction des parametres acoustiques
		les donnees sont placees dans les repertoire AC_DATA, MFCC et MFCC/log 
	
	-- 01_prepare_TEST_data.sh <EXPE_DIR> <TRS> <WAV>
		prepare les donnees du test dans le repertoire EXPE_DIR/TEST
		prepare les segmentations et les parametre acoustiques pour le decodage	

	-- 02_prepare_lexique.sh <EXPE_DIR>
		plusieurs fichiers sont necessaires avant la compilation en fst du modele de langue
		il faut notamment preparer les topologies de phonemes non silence et silence

	-- 03_compile_LM.sh <EXPE_DIR>
		compilation en fst du modele de langue
		il faut definir le arpa dans le variable en debut de script
	
	-- .... to be continued	

	/_ => utils
	/_ => steps
	/_ => LIA_utils
		scripts de mise en forme des fichiers trs vers le format kaldi

- LM_DATABASE
	contient le modele de language arpa decompresse, et le lexique format speeral ou kaldi 
	une variable d'envronnement permet de pointer vers le arpa

- EXPE_DIR/
	ce repertoire est cree lors de l'execution de Scripts/00_init_path.sh <path to expe>
	/_ => ACOUSTIC_MODEL
		modeles acoustiques compiles, les donnees necessaires, les graphes et les expe de decodage
	/_ => LANGUAGE_MODEL
		modele linguistique compile sous forme de fst
	/_ => AC_DATA
		donnees de preparation des parametres acoustiques
	/_ => LM_DATA
		donnees de prepa du fst
	/_ => TEST
		/_ => AC_DATA
		/_ => LM_DATA


# ********************* #

pas de parallélisation pour le moment (pas nécessaire d'initialisation la variable $cmd)