您的位置:首页 > 其它

深度学习应用整理

2016-11-17 15:03 399 查看
Deep Neural Netword 由Geoffrey E. Hinton 在06年提出后,效果不是很理想,直到近2年人们发现使用大量的数据去训练得到的模型能取得很好的效果。

深度学习的应用参考知乎:https://www.zhihu.com/question/47563637

深度学习tutorial:https://github.com/sjchoi86/dl_tutorials

图像识别(分类问题)



输入图像为: 32×32×3 。 长32像素,宽32像素,RGB3种通道

表示为一个列向量: [x1,x2,x3,...,x3072]T

KNN(慢,准确率低):先使用CNN得到特征映射,再用KNN

线性分类器: f(x,W) = W x + b #也可以写为 f = Wx, x=[1,x1,x2,x3,...,x3072]T,直接做矩阵乘法,不用加法

10×1 10×3072 3072×1 10×1

总共10个类

预处理: 去中心化:所有像素点减去像素点的均值(RGB三种颜色值都加在一起/也可以三种分别做均值,把输入数据各个维度都中心化到0,测试集也要减去训练数据得出的均值)。

图像通常不做scaling,取值范围在[0,255]

PCA降维:特征之间去相关,提取主成分

物体定位(回归问题)



输出是(x,y,w,h)

更细致的识别

提前定好有几个组成部分,训练,

Neural Style
具体原理查看论文:http://arxiv.org/pdf/1508.06576v2.pdf
博文:https://github.com/anishathalye/neural-style
博文:http://blog.csdn.net/shenxiaolu1984/article/details/52090012



卷积层 pooling 全连接

content-Loss: 评估内容相似:两张图片(原始图片和目标输出照片,初始化可以是原来照片也可以是style照片或者随机等)送入神经网络,卷积层输出的L2 loss。



输入两张图片,一张style picture,一张随机初始化。大小要相同。

style-Loss: gram metrics,不同神经元(feature map224*224,64个神经元)转化为向量64*(224*224),向量之间点乘。一个神经元要和其他64个神经元点乘,会得到64*64的矩阵。两张图片做点差,求Loss。

最后两个网络合成:



由于网络的结构是使用的训练好的model,作为参数优化的是也是一副图像。从公式中可以看出,总共是有3个卷积网络。

自动按照画风绘画: https://github.com/fzliu/style-transfer,
在git中搜索artistic style,或者neural artistic style,还会搜到artistic-videos项目。
自动创造诗:RNN,http://weibo.com/p/1001603850614961505585
自动创造音乐: http://www.cnblogs.com/charlotte77/p/5664523.html
git clone https://github.com/tensorflow/magenta.git 
已经训练好的网络model包括AlexNet和VGG等。

AlexNet

论文:http://www.cs.toronto.edu/~fritz/absps/imagenet.pdf

在imagenet上的图像分类challenge上Alex提出的alexnet网络结构模型赢得了2012届的冠军。要研究CNN类型DL网络模型在图像分类上的应用,就逃不开研究alexnet,这是CNN在图像分类上的经典模型(DL火起来之后)。
VGG net

在ImageNet Challenge 2014中获得第一,该网络在其他数据集上也能取得较好的效果。很多图像相关的项目都使用了vgg net。

vgg net paper: https://arxiv.org/pdf/1409.1556.pdf

vgg net application: http://glacier.iego.net/%E5%8D%B7%E7%A7%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C%E5%88%9D%E7%AA%A5-vgg19%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0/
雅虎开源的色情图片检测:

https://github.com/yahoo/open_nsfw

人脸识别on Tensorflow- FaceNet:

https://github.com/davidsandberg/facenet
DQN玩flappyBird:

MxNet: https://github.com/li-haoran/DRL-FlappyBird

TensorFlow:

https://github.com/yenchenlin/DeepLearningFlappyBird

https://github.com/songrotek/DRL-FlappyBird

聊天机器人的训练语料:https://github.com/rustch3n/dgk_lost_conv
(电影)
DeepQA(English):
https://github.com/Conchylicultor/DeepQA
seq2seq聊天机器人:https://github.com/nicolas-ivanov/tf_seq2seq_chatbot (lstm
on tensorflow)

https://github.com/inikdom/neural-chatbot

构建自己的聊天机器人(中文,NLTK):chatterbot:https://github.com/gunthercox/ChatterBot,
http://blog.just4fun.site/create-a-smart-chat-bot.html
MXNet在OCR的应用:https://zhuanlan.zhihu.com/p/21344595 (把图片上的文字转化为文本的过程),github:https://github.com/lan2720/cnn-for-captcha
基于MXNet的汽车车牌号识别:
https://github.com/imistyrain/mxnet-oneclick, 从图像中提取车牌号:https://zhuanlan.zhihu.com/p/21749729

欢迎大家留言补充。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: