基于HTK中文普通话语音识别DEMO,LilyMandarinSpeechRecognition V1.0
2015-03-12 15:31
543 查看
DEMO简介:
这是一个中文普通话语音识别的最简单DEMO,LilyMandarinSpeechRecognition
V1.0。
首先给出这款软件的下载链接:
DEMO_LilyMandarinSpeechRecognition.rar
或者 http://vdisk.weibo.com/s/AUDeE/1368171209
语音不仅是人类之间进行信息交流最自然,最有效,最方便的工具,而且也是人与机器之间进行通信的重要工具。语音识别(Automatic
Speech Recognition,ASR)技术能够让机器听懂人的声音,并做出正确的反应。本DEMO完全通过HTK工具(http://htk.eng.cam.ac.uk/)搭建。感谢HTK工作组对语音识别研究领域做出的伟大贡献。
使用方法:
将所有文件解压到同一文件夹下,要求此文件夹的完整路径(例如D:\Demos_Projects\LilyMandarinSpeechRecognition\DEMO_LilyMandarinSpeechRecognition)中没有空格或者其他奇怪的符号(例如&等)。然后双击LilyMandarinSpeechRecognition.exe,可以得到如下界面
然后点击OPEN打开波形文件,例如F05A62.wav,得到如下界面
然后我们可以选择播放PLAY或者其他的操作,这里我们仅演示DEMO的主要功能—语音识别,点击识别RECOGNIZE,这时候HTK就上场了,得到如下的界面
现在就是用HVite进行解码识别,速度较慢,识别一句话需要10秒左右,所以请稍微耐心一些。识别结束之后,就会出现如下的识别结果
此时用户可以播放音频,并对照识别结果。
后期我们的主要工作将是提高识别速度以及识别精度。
谢谢您的阅读和时间。
DEMO Description:
This is a Mandarin Chinese speech recognition easiest Demo LilyMandarinSpeechRecognition V1.0.
Voice is not only a human between the exchange of information is the most natural, the most effective, most convenient tool, but also an important tool of communication between man and machine. Speech recognition (Automatic Speech Recognition, ASR) technology
enables the machine to understand the human voice, and make the right response. The DEMO completely through the the HTK Tools (http://htk.eng.cam.ac.uk/) structures. Thanks for the great contribution made by the the HTK working group on the field of speech
recognition research.
本文引用地址:http://blog.sciencenet.cn/blog-907554-714371.html 此文来自科学网石自强博客
这是一个中文普通话语音识别的最简单DEMO,LilyMandarinSpeechRecognition
V1.0。
首先给出这款软件的下载链接:
DEMO_LilyMandarinSpeechRecognition.rar
或者 http://vdisk.weibo.com/s/AUDeE/1368171209
语音不仅是人类之间进行信息交流最自然,最有效,最方便的工具,而且也是人与机器之间进行通信的重要工具。语音识别(Automatic
Speech Recognition,ASR)技术能够让机器听懂人的声音,并做出正确的反应。本DEMO完全通过HTK工具(http://htk.eng.cam.ac.uk/)搭建。感谢HTK工作组对语音识别研究领域做出的伟大贡献。
使用方法:
将所有文件解压到同一文件夹下,要求此文件夹的完整路径(例如D:\Demos_Projects\LilyMandarinSpeechRecognition\DEMO_LilyMandarinSpeechRecognition)中没有空格或者其他奇怪的符号(例如&等)。然后双击LilyMandarinSpeechRecognition.exe,可以得到如下界面
然后点击OPEN打开波形文件,例如F05A62.wav,得到如下界面
然后我们可以选择播放PLAY或者其他的操作,这里我们仅演示DEMO的主要功能—语音识别,点击识别RECOGNIZE,这时候HTK就上场了,得到如下的界面
现在就是用HVite进行解码识别,速度较慢,识别一句话需要10秒左右,所以请稍微耐心一些。识别结束之后,就会出现如下的识别结果
此时用户可以播放音频,并对照识别结果。
后期我们的主要工作将是提高识别速度以及识别精度。
谢谢您的阅读和时间。
DEMO Description:
This is a Mandarin Chinese speech recognition easiest Demo LilyMandarinSpeechRecognition V1.0.
Voice is not only a human between the exchange of information is the most natural, the most effective, most convenient tool, but also an important tool of communication between man and machine. Speech recognition (Automatic Speech Recognition, ASR) technology
enables the machine to understand the human voice, and make the right response. The DEMO completely through the the HTK Tools (http://htk.eng.cam.ac.uk/) structures. Thanks for the great contribution made by the the HTK working group on the field of speech
recognition research.
本文引用地址:http://blog.sciencenet.cn/blog-907554-714371.html 此文来自科学网石自强博客
相关文章推荐
- 2,HTK学习_基于HTK语音工具包进行孤立词识别的使用教程
- 避开Google Voice Search利用Google Speech API实现Android语音识别之Demo实现
- 基于HTK语音工具包进行孤立词识别的使用教程
- 基于HTK语音工具包进行孤立词识别的使用教程
- c#基于speech sdk中文限制语音识别XML初探
- System.Speech.Recognition 语音识别
- 基于HTK语音工具包进行孤立词识别的使用教程
- 一套基于模板匹配的语音识别技术。提取语音的特征,并建立模板库,可以将语音识别技术应用于机器人
- C#中英文语音合成与中文语音识别技术
- [转]中英文语音合成与中文语音识别技术在c#中的应用(二)
- <一>基于Fourinone实现分布式计算上手指南和demo
- 基于TMS320VC5509A的语音识别与控制系统
- (转)中文语音识别技术在c#中的应用(一) 出处:CSDN
- Speech Recognition on Cloud Computing 基于云计算的语音识别
- 基于HTK的语音拨号系统
- 中文语音识别技术在C#中的应用
- [转]中英文语音合成与中文语音识别技术在c#中的应用(一)
- 中英文语音合成与中文语音识别技术在c#中的应用(一)
- 中文语音识别技术在c#中的应用(二)
- C#中英文语音合成与中文语音识别技术