您的位置:首页 > 其它

声纹测试结果分析

2017-07-17 14:37 246 查看
EER

用的清华数据集训练(8000HZ,16bit)

测试数据是自己录制的对应8000HZ,16bit

使用清华数据集自带的测试集10s注册,EER在7%左右,20s注册。EER在4%左右;

自己录制测试语音的分值几个都比较接近:



分析可能的原因:
1、8k采样率低了,群里测试语音识别8k的准确率会降低不少,普遍采用16k
2、没有加入自己的数据进行训练
3、信道干扰,训练的数据还是相对“干净”许多
4、训练集不够

识别太过耗时
提取IVECTOR(ivector 400dim 、gmm 1024dim、11s的语音)居然需要7s才完成,非常慢,具体原因还在分析,还不清楚为什么这么耗时
处理:经过代码段执行时间检测,定位到,耗时的主要是IVECTOR提取器加载的过程,要接近4s才能完成
clock_t start = clock();

// g_num_threads affects how ComputeDerivedVars is called when we read the
// extractor.
g_num_threads = sequencer_config.num_threads;
IvectorExtractor extractor;
ReadKaldiObject(ivector_extractor_rxfilename, &extractor);

clock_t ends = clock();
KALDI_LOG << "Running Time : " << (double)(ends - start) / CLOCKS_PER_SEC;
// Running Time : 3.76
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: