您的位置:首页 > 其它

语音识别面临挑战浅谈

2018-09-30 09:18 127 查看

        语音交流是人与人之间进行交流互动的最便捷、最准确和最自然的途径之一。基于语音的人机交互技术研究涵盖了广泛的研究领域,包括语言语言韵律学、语音产生于感知、音频信号处理、语音合成、语音识别、自然语言理解、机器翻译等等。其中,语音合成、语音识别和自然语言理解在人机交互语音技术中处于非常核心的关键技术。在这三者中,AI语音智能就是把人的语音转换成相应的文本、命令以便计算机进行理解、产生相应操作的自动语音识别技术是最重要、最困难的核心技术。

        语音识别是涉及心理学、生理学、声学、语言学、信息理论、信号处理、计算机科学、模式识别等多个学科的交叉学科,具有广阔的应用前景,如语音检索、命令控制、自动客户服务、机器自动翻译等。当今信息社会的高速发展迫切需要性能优越的,能满足各种不同需求的自动语音识别技术。但是,这样的目标面临着诸多的困难,如:语音信号会受到上下文的影响而发生变化;发音人以及口音的的不同会导致语音特征在参数空间分布的不同;同一发音人心理和生理变化带来的语音变化;不同的发音方式和习惯引起的省略、连读等多变的语音现象;环境和信道等因素造成的语音信号失真问题。这些语音识别中需要考虑和处理的诸多可变因素,使得语音识别这个对人脑来说看起来不费吹灰之力的事情,在机器面前显得困难重重。具有自然对话风格的大词汇量连续语音识别(large vocabulary continuous speech recognition,LVCSR)研究是当前研究的热点和难点。
 

阅读更多
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: