您的位置:首页 > 其它

在终端设备上实现语音识别:ARM开源了TensorFlow预训练模型

2017-12-14 00:00 671 查看
林鳞 编译整理
量子位 出品 | 公众号 QbitAI
关键词识别(Keyword Spotting,KWS)是语音识别领域的一个子领域,在用户在智能设备上进行语音交互时起到重要作用。

[b]△ 关键词识别pipeline[/b]近日,ARM和斯坦福大学合作开源了预训练TensorFlow模型和它们的语音关键词识别代码,并将结果发表在论文Hello Edge: Keyword Spotting on Microcontrollers中。这个开源库包含了TensorFlow模型和在论文中用到的训练脚本。在论文中,研究人员还展示了不同的神经网络架构,包含DNN、CNN、Basic LSTM、LSTM、GRU、CRNN和DS-CNN,并将这些架构加入到预训练模型中。预训练模型地址:https://github.com/ARM-software/ML-KWS-for-MCU/tree/master/Pretrained_models

论文摘要

在研究中,研究人员评估了神经网络架构,并且在资源受限的微控制器上运行KWS。他们训练了多种神经网络架构变体,并比较变体之间的准确性和存储/计算需求。

[b]△ 神经网络模型的准确性[/b]研究人员发现,在不损失精确度的情况下,在存储了计算资源受限的微控制器上优化这些神经网络架构可行。

之后,研究人员还进一步探索了DS-CNN架构,并且和其他神经网络架构进行了对比。结果证明,DS-CNN架构的准确性最高,为95.4%,比超参数相似的DNN模型精确度约高10%。


[b]△ 超参数搜索中的最佳神经网络[/b]

相关资料

论文下载地址:https://arxiv.org/pdf/1711.07128.pdf项目代码地址:https://github.com/ARM-software/ML-KWS-for-MCU—
活动报名


加入社群量子位AI社群12群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot4入群;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进群请加小助手微信号qbitbot4,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。


量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐