run.sh 10.7 KB
edit raw blame history



1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

252

253

254

255

256

257

258

259

260

261

262

263

264

265

266

267

268

269

270

271

272

273

274

275


#!/bin/bash
# Copyright 2015-2017   David Snyder
#                2015   Johns Hopkins University (Author: Daniel Garcia-Romero)
#                2015   Johns Hopkins University (Author: Daniel Povey)
# Apache 2.0.
#
# See README.txt for more info on data required.
# Results (EERs) are inline in comments below.
#
# This example script shows how to replace the GMM-UBM
# with a DNN trained for ASR. It also demonstrates the
# using the DNN to create a supervised-GMM.

. ./cmd.sh
. ./path.sh
set -e
mfccdir=`pwd`/mfcc
vaddir=`pwd`/mfcc
trials_female=data/sre10_test_female/trials
trials_male=data/sre10_test_male/trials
trials=data/sre10_test/trials
nnet=exp/nnet2_online/nnet_ms_a/final.mdl

# Train a DNN on about 1800 hours of the english portion of Fisher.
local/dnn/train_dnn.sh

# Prepare the SRE 2010 evaluation data.
local/make_sre_2010_test.pl /export/corpora5/SRE/SRE2010/eval/ data/
local/make_sre_2010_train.pl /export/corpora5/SRE/SRE2010/eval/ data/

# Prepare a collection of NIST SRE data prior to 2010. This is
# used to train the PLDA model and is also combined with SWB
# for UBM and i-vector extractor training data.
local/make_sre.sh data

# Prepare SWB for UBM and i-vector extractor training.
local/make_swbd2_phase2.pl /export/corpora5/LDC/LDC99S79 \
  data/swbd2_phase2_train
local/make_swbd2_phase3.pl /export/corpora5/LDC/LDC2002S06 \
  data/swbd2_phase3_train
local/make_swbd_cellular1.pl /export/corpora5/LDC/LDC2001S13 \
  data/swbd_cellular1_train
local/make_swbd_cellular2.pl /export/corpora5/LDC/LDC2004S07 \
  data/swbd_cellular2_train

utils/combine_data.sh data/train \
  data/swbd_cellular1_train data/swbd_cellular2_train \
  data/swbd2_phase2_train data/swbd2_phase3_train data/sre

utils/copy_data_dir.sh data/train data/train_dnn
utils/copy_data_dir.sh data/sre data/sre_dnn
utils/copy_data_dir.sh data/sre10_train data/sre10_train_dnn
utils/copy_data_dir.sh data/sre10_test data/sre10_test_dnn

# Extract speaker recogntion features.
steps/make_mfcc.sh --mfcc-config conf/mfcc.conf --nj 40 --cmd "$train_cmd" \
  data/train exp/make_mfcc $mfccdir
steps/make_mfcc.sh --mfcc-config conf/mfcc.conf --nj 40 --cmd "$train_cmd" \
  data/sre exp/make_mfcc $mfccdir
steps/make_mfcc.sh --mfcc-config conf/mfcc.conf --nj 40 --cmd "$train_cmd" \
  data/sre10_train exp/make_mfcc $mfccdir
steps/make_mfcc.sh --mfcc-config conf/mfcc.conf --nj 40 --cmd "$train_cmd" \
  data/sre10_test exp/make_mfcc $mfccdir

# Extract DNN features.
steps/make_mfcc.sh --mfcc-config conf/mfcc_hires.conf --nj 40 \
  --cmd "$train_cmd" data/train_dnn exp/make_mfcc $mfccdir
steps/make_mfcc.sh --mfcc-config conf/mfcc_hires.conf --nj 40 \
  --cmd "$train_cmd" data/sre_dnn exp/make_mfcc $mfccdir
steps/make_mfcc.sh --mfcc-config conf/mfcc_hires.conf --nj 40 \
  --cmd "$train_cmd" data/sre10_train_dnn exp/make_mfcc $mfccdir
steps/make_mfcc.sh --mfcc-config conf/mfcc_hires.conf --nj 40 \
  --cmd "$train_cmd" data/sre10_test_dnn exp/make_mfcc $mfccdir

for name in sre_dnn sre10_train_dnn sre10_test_dnn train_dnn sre \
  sre10_train sre10_test train; do
  utils/fix_data_dir.sh data/${name}
done

# Compute VAD decisions. These will be shared across both sets of features.
sid/compute_vad_decision.sh --nj 40 --cmd "$train_cmd" \
  data/train exp/make_vad $vaddir
sid/compute_vad_decision.sh --nj 40 --cmd "$train_cmd" \
  data/sre exp/make_vad $vaddir
sid/compute_vad_decision.sh --nj 40 --cmd "$train_cmd" \
  data/sre10_train exp/make_vad $vaddir
sid/compute_vad_decision.sh --nj 40 --cmd "$train_cmd" \
  data/sre10_test exp/make_vad $vaddir

for name in sre sre10_train sre10_test train; do
  cp data/${name}/vad.scp data/${name}_dnn/vad.scp
  cp data/${name}/utt2spk data/${name}_dnn/utt2spk
  cp data/${name}/spk2utt data/${name}_dnn/spk2utt
  utils/fix_data_dir.sh data/${name}
  utils/fix_data_dir.sh data/${name}_dnn
done

# Subset training data for faster sup-GMM initialization.
utils/subset_data_dir.sh data/train_dnn 32000 data/train_dnn_32k
utils/fix_data_dir.sh data/train_dnn_32k
utils/subset_data_dir.sh --utt-list data/train_dnn_32k/utt2spk \
  data/train data/train_32k
utils/fix_data_dir.sh data/train_32k

# Initialize a full GMM from the DNN posteriors and speaker recognition
# features. This can be used both alone, as a UBM, or to initialize the
# i-vector extractor in a DNN-based system.
sid/init_full_ubm_from_dnn.sh --cmd "$train_cmd --mem 15G" \
  data/train_32k \
  data/train_dnn_32k $nnet exp/full_ubm

# Train an i-vector extractor based on just the supervised-GMM.
sid/train_ivector_extractor.sh \
  --cmd "$train_cmd --mem 120G" \
  --ivector-dim 600 \
  --num-iters 5 exp/full_ubm/final.ubm data/train \
  exp/extractor_sup_gmm

# Train an i-vector extractor based on the DNN-UBM.
sid/train_ivector_extractor_dnn.sh \
  --cmd "$train_cmd --mem 100G" --nnet-job-opt "--mem 4G" \
  --min-post 0.015 --ivector-dim 600 --num-iters 5 \
  exp/full_ubm/final.ubm $nnet \
  data/train \
  data/train_dnn \
  exp/extractor_dnn

# Extract i-vectors from the extractor with the sup-GMM UBM.
sid/extract_ivectors.sh \
  --cmd "$train_cmd --mem 12G" --nj 40 \
  exp/extractor_sup_gmm data/sre10_train \
  exp/ivectors_sre10_train_sup_gmm

sid/extract_ivectors.sh \
  --cmd "$train_cmd --mem 12G" --nj 40 \
  exp/extractor_sup_gmm data/sre10_test \
  exp/ivectors_sre10_test_sup_gmm

sid/extract_ivectors.sh \
  --cmd "$train_cmd --mem 12G" --nj 40 \
  exp/extractor_sup_gmm data/sre \
  exp/ivectors_sre_sup_gmm

# Extract i-vectors using the extractor with the DNN-UBM.
sid/extract_ivectors_dnn.sh \
  --cmd "$train_cmd --mem 15G" --nj 10 \
  exp/extractor_dnn \
  $nnet \
  data/sre10_test \
  data/sre10_test_dnn \
  exp/ivectors10_test_dnn

sid/extract_ivectors_dnn.sh \
   --cmd "$train_cmd --mem 15G" --nj 10 \
  exp/extractor_dnn \
  $nnet \
  data/sre10_train \
  data/sre10_train_dnn \
  exp/ivectors10_train_dnn

sid/extract_ivectors_dnn.sh \
  --cmd "$train_cmd --mem 15G" --nj 10 \
  exp/extractor_dnn \
  $nnet \
  data/sre \
  data/sre_dnn \
  exp/ivectors_sre_dnn

# Separate the i-vectors into male and female partitions and calculate
# i-vector means used by the scoring scripts.
local/scoring_common.sh data/sre data/sre10_train data/sre10_test \
  exp/ivectors_sre_sup_gmm exp/ivectors_sre10_train_sup_gmm \
  exp/ivectors_sre10_test_sup_gmm

local/scoring_common.sh data/sre data/sre10_train data/sre10_test \
  exp/ivectors_sre_dnn exp/ivectors_sre10_train_dnn \
  exp/ivectors_sre10_test_dnn

# The commented out scripts show how to do cosine scoring with and without
# first reducing the i-vector dimensionality with LDA. PLDA tends to work
# best, so we don't focus on the scores obtained here.
#
# local/cosine_scoring.sh data/sre10_train data/sre10_test \
#   exp/ivectors_sre10_train exp/ivectors_sre10_test $trials \
#   exp/scores_gmm_2048_ind_pooled
# local/lda_scoring.sh data/sre data/sre10_train data/sre10_test \
#   exp/ivectors_sre exp/ivectors_sre10_train exp/ivectors_sre10_test \
#   $trials exp/scores_gmm_2048_ind_pooled

# Create a gender independent PLDA model and do scoring with the sup-GMM system.
local/plda_scoring.sh data/sre data/sre10_train data/sre10_test \
  exp/ivectors_sre_sup_gmm exp/ivectors_sre10_train_sup_gmm \
  exp/ivectors_sre10_test_sup_gmm $trials exp/scores_sup_gmm_ind_pooled
local/plda_scoring.sh --use-existing-models true data/sre data/sre10_train_female data/sre10_test_female \
  exp/ivectors_sre_sup_gmm exp/ivectors_sre10_train_sup_gmm_female \
  exp/ivectors_sre10_test_sup_gmm_female $trials_female exp/scores_sup_gmm_ind_female
local/plda_scoring.sh --use-existing-models true data/sre data/sre10_train_male data/sre10_test_male \
  exp/ivectors_sre_sup_gmm exp/ivectors_sre10_train_sup_gmm_male \
  exp/ivectors_sre10_test_sup_gmm_male $trials_male exp/scores_sup_gmm_ind_male

# Create gender dependent PLDA models and do scoring with the sup-GMM system.
local/plda_scoring.sh data/sre_female data/sre10_train_female data/sre10_test_female \
  exp/ivectors_sre_sup_gmm exp/ivectors_sre10_train_sup_gmm_female \
  exp/ivectors_sre10_test_sup_gmm_female $trials_female exp/scores_sup_gmm_dep_female
local/plda_scoring.sh data/sre_male data/sre10_train_male data/sre10_test_male \
  exp/ivectors_sre_sup_gmm exp/ivectors_sre10_train_sup_gmm_male \
  exp/ivectors_sre10_test_sup_gmm_male $trials_male exp/scores_sup_gmm_dep_male

# Pool the gender dependent results
mkdir -p exp/scores_sup_gmm_dep_pooled
cat exp/scores_sup_gmm_dep_male/plda_scores exp/scores_sup_gmm_dep_female/plda_scores \
  > exp/scores_sup_gmm_dep_pooled/plda_scores

# Create a gender independent PLDA model and do scoring with the DNN system.
local/plda_scoring.sh data/sre data/sre10_train data/sre10_test \
  exp/ivectors_sre_dnn exp/ivectors_sre10_train_dnn \
  exp/ivectors_sre10_test_dnn $trials exp/scores_dnn_ind_pooled
local/plda_scoring.sh --use-existing-models true data/sre data/sre10_train_female data/sre10_test_female \
  exp/ivectors_sre_dnn exp/ivectors_sre10_train_dnn_female \
  exp/ivectors_sre10_test_dnn_female $trials_female exp/scores_dnn_ind_female
local/plda_scoring.sh --use-existing-models true data/sre data/sre10_train_male data/sre10_test_male \
  exp/ivectors_sre_dnn exp/ivectors_sre10_train_dnn_male \
  exp/ivectors_sre10_test_dnn_male $trials_male exp/scores_dnn_ind_male

# Create gender dependent PLDA models and do scoring with the DNN system.
local/plda_scoring.sh data/sre_female data/sre10_train_female data/sre10_test_female \
  exp/ivectors_sre_dnn exp/ivectors_sre10_train_dnn_female \
  exp/ivectors_sre10_test_dnn_female $trials_female exp/scores_dnn_dep_female
local/plda_scoring.sh data/sre_male data/sre10_train_male data/sre10_test_male \
  exp/ivectors_sre_dnn exp/ivectors_sre10_train_dnn_male \
  exp/ivectors_sre10_test_dnn_male $trials_male exp/scores_dnn_dep_male

mkdir -p exp/scores_dnn_dep_pooled
cat exp/scores_dnn_dep_male/plda_scores exp/scores_dnn_dep_female/plda_scores \
  > exp/scores_dnn_dep_pooled/plda_scores

# Sup-GMM PLDA EER
# ind pooled: 1.72
# ind female: 1.81
# ind male:   1.70
# dep female: 2.03
# dep male:   1.50
# dep pooled: 1.79
echo "Sup-GMM EER"
for x in ind dep; do
  for y in female male pooled; do
    eer=`compute-eer <(python local/prepare_for_eer.py $trials exp/scores_sup_gmm_${x}_${y}/plda_scores) 2> /dev/null`
    echo "${x} ${y}: $eer"
  done
done

# DNN-UBM EER
# ind pooled: 1.01
# ind female: 1.16
# ind male:   0.78
# dep female: 1.27
# dep male:   0.61
# dep pooled: 0.96
echo "DNN-UBM EER"
for x in ind dep; do
  for y in female male pooled; do
    eer=`compute-eer <(python local/prepare_for_eer.py $trials exp/scores_dnn_${x}_${y}/plda_scores) 2> /dev/null`
    echo "${x} ${y}: $eer"
  done
done

# In comparison, here is the EER for an unsupervised GMM-based system
# with 5297 components (about the same as the number of senones in the DNN):
# GMM-5297 PLDA EER
# ind pooled: 2.25
# ind female: 2.33
# ind male:   2.08
# dep female: 2.25
# dep male:   1.50
# dep pooled: 1.91