声纹测试结果分析
2017-07-17 14:37
246 查看
EER
用的清华数据集训练(8000HZ,16bit)
测试数据是自己录制的对应8000HZ,16bit
使用清华数据集自带的测试集10s注册,EER在7%左右,20s注册。EER在4%左右;
自己录制测试语音的分值几个都比较接近:
分析可能的原因:
1、8k采样率低了,群里测试语音识别8k的准确率会降低不少,普遍采用16k
2、没有加入自己的数据进行训练
3、信道干扰,训练的数据还是相对“干净”许多
4、训练集不够
识别太过耗时
提取IVECTOR(ivector 400dim 、gmm 1024dim、11s的语音)居然需要7s才完成,非常慢,具体原因还在分析,还不清楚为什么这么耗时
处理:经过代码段执行时间检测,定位到,耗时的主要是IVECTOR提取器加载的过程,要接近4s才能完成
clock_t start = clock();
// g_num_threads affects how ComputeDerivedVars is called when we read the
// extractor.
g_num_threads = sequencer_config.num_threads;
IvectorExtractor extractor;
ReadKaldiObject(ivector_extractor_rxfilename, &extractor);
clock_t ends = clock();
KALDI_LOG << "Running Time : " << (double)(ends - start) / CLOCKS_PER_SEC;
// Running Time : 3.76
用的清华数据集训练(8000HZ,16bit)
测试数据是自己录制的对应8000HZ,16bit
使用清华数据集自带的测试集10s注册,EER在7%左右,20s注册。EER在4%左右;
自己录制测试语音的分值几个都比较接近:
分析可能的原因:
1、8k采样率低了,群里测试语音识别8k的准确率会降低不少,普遍采用16k
2、没有加入自己的数据进行训练
3、信道干扰,训练的数据还是相对“干净”许多
4、训练集不够
识别太过耗时
提取IVECTOR(ivector 400dim 、gmm 1024dim、11s的语音)居然需要7s才完成,非常慢,具体原因还在分析,还不清楚为什么这么耗时
处理:经过代码段执行时间检测,定位到,耗时的主要是IVECTOR提取器加载的过程,要接近4s才能完成
clock_t start = clock();
// g_num_threads affects how ComputeDerivedVars is called when we read the
// extractor.
g_num_threads = sequencer_config.num_threads;
IvectorExtractor extractor;
ReadKaldiObject(ivector_extractor_rxfilename, &extractor);
clock_t ends = clock();
KALDI_LOG << "Running Time : " << (double)(ends - start) / CLOCKS_PER_SEC;
// Running Time : 3.76
相关文章推荐
- 输出hadoop[置顶] hadoop之测试KMeans(二):输出结果分析
- MongoDB、HandlerSocket和MySQL性能测试及其结果分析
- 性能测试结果分析
- 关于异步事件的一个测试及其分析结果
- LoadRunner性能测试结果分析样例
- AB测试结果分析
- Loadrunner性能测试结果实例分析_01
- LoadRunner压力测试结果分析探讨(二)
- Jmeter测试结果分析(上)
- redis 集群性能测试结果分析
- monkey测试结果分析
- apache ab压力测试结果分析
- ab 压力测试 命令详解与结果分析
- TPCC-UVA测试环境搭建与结果分析
- LoadRunner分析测试结果
- 团队角色测试(结果分析已公布)
- 性能测试之LoardRunner 结果分析
- LR性能测试结果样例分析
- Monkey测试3——Monkey测试结果分析
- 【转】Jmeter测试结果分析