您的位置:首页 > 其它

区分性训练训练流程简述(使用HTK工具)

2013-06-20 12:49 369 查看
区分性训练一般用于大词汇量连续语音识别,在HTK中有一整套训练流程(具体可参阅HTKBook v3.4.1 p55-58)。通常而言,30个小时区分语料即可看到提升效果。

如果使用HTK做DT训练一般可分五步走。

第一步:训练一个最大似然(ML)的词间模型;

第二步:训练一个语言模型,一般而言,一元语言模型就已足够。语言模型的训练文本完全来自你用于区分训练的语料的标注文本。

第三步:创建词级的lattice;

第四步:创建音素级的lattice

第五步:迭代训练。在这一步之前要注意检查上一步训练产生的lattice,如果生成的lattice有问题,可能会导致迭代失败。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  区分性训练 HTK 流程