您的位置：首页 > 其它

声纹测试结果分析

2017-07-17 14:37 246 查看

EER

用的清华数据集训练（8000HZ，16bit）

测试数据是自己录制的对应8000HZ，16bit

使用清华数据集自带的测试集10s注册，EER在7%左右，20s注册。EER在4%左右；

自己录制测试语音的分值几个都比较接近：

分析可能的原因：
1、8k采样率低了，群里测试语音识别8k的准确率会降低不少，普遍采用16k
2、没有加入自己的数据进行训练
3、信道干扰，训练的数据还是相对“干净”许多
4、训练集不够

识别太过耗时
提取IVECTOR（ivector 400dim 、gmm 1024dim、11s的语音）居然需要7s才完成，非常慢，具体原因还在分析，还不清楚为什么这么耗时
处理：经过代码段执行时间检测，定位到，耗时的主要是IVECTOR提取器加载的过程，要接近4s才能完成
clock_t start = clock();

// g_num_threads affects how ComputeDerivedVars is called when we read the
// extractor.
g_num_threads = sequencer_config.num_threads;
IvectorExtractor extractor;
ReadKaldiObject(ivector_extractor_rxfilename, &extractor);

clock_t ends = clock();
KALDI_LOG << "Running Time : " << (double)(ends - start) / CLOCKS_PER_SEC;
// Running Time : 3.76

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航