您的位置:首页 > 其它

科大讯飞语音功能小结

2013-11-28 13:33 260 查看
这段时间在做关于语音识别的开发,在网上找了找,现在国内在做语音的有科大讯飞,云知声,捷通华声,紫冬锐意,据说今年12月份中旬,微信的语音接口会向第三方应用提供,很期待啊。。。

对于科大讯飞和云知声我稍作了研究,下面呢说一下科大讯飞吧。

科大讯飞的示例demo比较炕爹,它必须在你申请的appid基础上运行,否则会出错哦!也就是你必须申请appid,然后才能下载示例demo,很炕爹吧!

这里我就不多余重复开发文档中的了,说一些自己的理解:

1.我之前有一个想法,就是科大讯飞在语音识别的时候,需要你上传命令词,词表或者联系人,我们可以在注册开发者的时候在自己的信息中上传自己的词库,然后我们在程序中只需要通过登录来获取一个标示token什么的,这样的话,如果你的词库发生变化了,就不需要更改代码了,只需要在自己的开发者信息下重新上传一下,不用更改程序了,科大讯飞的技术支持的回复是web端没有提供这个接口,他们的回复是:我们可以申请一个web端的appid,然后在自己的服务器上做这样的处理

2. 词表和联系人在上传的时候没有返回grammerID,在语音识别的时候需要登录,上传一次;命令词和abnf语法上传也是上传一次,但是这里会回复一个grammerID这样就需要在语音识别的时候传参。

3.命令词和词表的区别在于:

命令词:语音识别的时候会只在命令词的范围内搜索

词表:语音识别优先从词表总搜索

4.在添加的框架中如果是在ios5系统下ADSupport.framework要设为optional

5.如果想要自定义UI则须参考无UI的demo,然后在- (void) onVolumeChanged: (int) volume;这个回调里面随着语音的音量大小来切换图片

6.grammerID可以跨平台使用

26/12/2013

今天我进行内容添加,微信语音开放平台也已经对外开放,但是其功能上并没有科大讯飞的强大(到目前为止),而且其识别精确率也只有95%,这里就不做介绍了,都差不多的,链接地址:http://pr.weixin.qq.com/voice/

先到这里,还会续写。。。。。。

科大讯飞开发文档和SDK下载地址:http://open.voicecloud.cn/download.php
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: