树莓派魔镜总结(包括语音和图像识别)
2017-04-10 22:25
561 查看
我实在是太懒了,现在才来写这篇博文。
这里我将总结做这个项目所用的思路,以及中间出现的各种问题还有问题的解决办法。
这里我将总结做这个项目所用的思路,以及中间出现的各种问题还有问题的解决办法。
1、最终实现方案(树莓派、php+html、arecord、百度语音、face++图像识别)
1.1、硬件部分
因为加了一个开关来控制语音的录入,所以用到了树莓派的中断,因此硬件的话除了树莓派还多了一个开关和几条杜邦线跟几个小电阻。最后开关与树莓派的电路图如下所示: ![这里写图片描述](http://img.blog.csdn.net/20170410222711875?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY3Njc2hhaGE=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast) 当然还有一个显示器和一个带开关的4口usb拖线板。对了,还有一个带麦的USB无驱动摄像头,淘宝上能搜到只要几十块一个,一定要问好是不是无驱动的,麦克风也要是无驱的。第一次买的时候摄像头是无驱了但是麦克风却要声卡。最后的部件和成果图如下。 其实显示器是带触屏功能的,但是一直没有搞定驱动,所以最后用了开关里进行交互。
1.2、软件部分
软件部分主要包括交互界面和后台控制。 其中交互界面主要是通过chromium浏览器的kiosk模式来实现全屏,然后搭建一个本地的web服务器来显示界面。主要用到的技术是apach+php+html+css+js。因为对前端技术还是比较生疏,所以只能用这用方式来实现,而且html+css+js这一部分也写得很糟糕。 后台控制的话主要是通过C程序来进行全程的调度,然后用php来处理网络接口和业务逻辑。其中用到了opencv的库来进行实时摄像和wiringPi库来进行中断。对了,还用了arecord来进行录音。然后图像识别的话是用了face++的网络接口,语音识别与合成则是用了百度的接口。其实一开始是想用讯飞的接口,但是他们给的接口示例大部分是通过js实现的,不像百度的接口都是RESTful API 的风格,由于本人的前端技术尚浅所以最后选择了百度的接口。
相关文章推荐
- 自己总结的I5801刷机过程~~~ 包括SIM卡无法识别,刷基带!!!
- 基于motion视频捕捉软件的树莓派视频拍照系统(图像变化识别+拍照+邮件)
- Atitit 图像清晰度 模糊度 检测 识别 评价算法 源码实现attilax总结
- [树莓派(raspberry pi)] 02、PI3安装openCV开发环境做图像识别(详细版)
- Atitit 图像处理--图像分类 模式识别 肤色检测识别原理 与attilax的实践总结
- 语音识别 VC++基于微软语音引擎SAPI开发语音识别总结
- Atitit图像识别的常用特征大总结attilax大总结
- 树莓派——科大讯飞离线语音识别
- Atitit图像识别的常用特征大总结attilax大总结
- 图像识别常用的三角函数公式总结!
- 树莓派搭建图像识别基站
- 语音识别之----什么是语音识别中的mfcc(包括代码)
- 验证码识别系统以及人工智能总结 神经网络encog图像识别入门
- 细胞识别图像处理项目总结
- 图像识别中的FAR,FRR,ERR总结
- 树莓派自带摄像头OpenCV图像识别-二维码识别
- 语音识别 Search and Decoding 总结
- PHP调用百度AI接口人脸识别-语音技术-文本识别-图像识别
- 图像处理中小球的识别(简单总结)
- Andrew Ng机器学习课程笔记--week11(图像识别&总结划重点)