使用python和IBM speech to text 进行 语音识别
2017-03-08 00:53
399 查看
目录视图
摘要视图
订阅
CSDN日报20170303——《百亿互金平台救火故事》 程序员2月书讯 社区有奖问答--一起舞动酷炫的iOS动画 基于Spark的分布式深度学习和认知计算
使用python和IBM speech to text 进行 语音识别
标签: 语音识别ibmpythonapi2015-11-10 17:22 1403人阅读 评论(0) 收藏 举报
分类:
程序模块(14)
编程语言(13)
版权声明:本文为博主原创文章,未经博主允许不得转载。
wav 转 text ,感觉 还是IBM 的 speech to text 比较靠得住。
比百度的语音识别API好上太多。
[html] view
plain copy
https://speech-to-text-demo.mybluemix.net/
--------------------------------------------------------------------
注册拿到 帐号密码后,
有一个包比较 方便 调用
是SpeechRecogntion
[html] view
plain copy
https://pypi.python.org/pypi/SpeechRecognition/
pip install 或者 按照说明 安装就行了
---------------------------------------------------------------------
SpeechRecognition包含多个网站的API
然而Google的并不能用,AT&T的没试过。
--------------------------------------------------------------------
在debian 上测试的时候有个问题,需要 管理 员权限 。
可能是内部有过wav 2 flac 然后把临时文件 保存在dist-package下了,
--------------------------------------------------------------------
SpeechRecognition有示例代码wav_transcribe.py;
如果用于识别中文,需要在speechrecognition/__init__.py中,
修改recognize_ibm函数的482行
[python] view
plain copy
assert language in ["en-US", "es-ES", "ja-JP"], "`language` must be a valid language."
增加"zh-CN"项,
[python] view
plain copy
assert language in ["en-US", "es-ES", "ja-JP", "zh-CN"], "`language` must be a valid language."
---------------------------------------------------------------------
SpeechRecognition的用法 如下
[python] view
plain copy
import speech_recognition as sr
读wav文件
[python] view
plain copy
r = sr.Recognizer()
with sr.WavFile(path) as source:
audio = r.record(source)
然后可以调用 recognize_ibm 返回识别结果,是utf8格式的,一般写起来 会有些问题
[python] view
plain copy
IBM_USERNAME = 'XXXXXXXX'
IBM_PASSWORD= 'XXXXXXXX'
text = r.recognize_ibm(audio, username = IBM_USERNAME, password = IBM_PASSWORD, language = 'zh-CN')
text 就是识别结果,可能会有编码问题之类的。
相关文章推荐
- 使用C#进行语音识别(Speech-to-Text)
- Android:使用Speech To Text API进行语音到文本转换
- Android TTS 中文 文字转语音 使用TextToSpeech Svox .
- 在C++Builder使用TTS(Text To Speech)
- Android中使用TTS(TextToSpeech)将文字转为语音
- TextToSpeech自动朗读使用
- android中TextToSpeech的使用
- Android中TextToSpeech的简单使用
- TextToSpeech的使用
- 使用Svox实现中文转语音TextToSpeech(TTS)
- Android中的TextToSpeech 将文本转换成语音的简单使用。
- MFC使用Google Speech API进行语音识别
- TextToSpeech将文本转为语音的简单使用
- 使用ios7中的tts(text to speech)功能
- 安卓文字转语音实例+代码+TextToSpeech的使用
- Android TTS 中文 文字转语音 使用TextToSpeech Svox
- Android TTS 中文 文字转语音 使用TextToSpeech Svox
- 使用TextToSpeech实现文本转音频(自动朗读)
- 使用安卓中的TextToSpeech控件实现朗读文字