您的位置：首页 > 编程语言 > Go语言

论文阅读ImageNet Classiﬁcation with Deep Convolutional Neural Networks &Going Deeper with Convolutions

2017-03-18 16:18 417 查看

LeNet是CNN的开端：输入层，卷积层，池化层，全连接层，输出层五脏俱全，是现代CNN网络的基础组件。

这篇博文介绍了LeNet-5 : http://blog.csdn.net/qiaofangjie/article/details/1682684
LeNet-5：共有7层。

2012年AlexNet网络的极大进步，主要是引入了relu函数，dropout技巧，大规模数据的训练，百万级别的ImageNet图像数据，硬件上GPU的实现等。

后来的VGG，GoogleNet，ResNet等，都是在网络层数上加深，或者是重新设计网络的结构，以增强网络的可表达性，或者说是使网络性能更强，具有更好的识别或者是分类能力。

数据集介绍：

ImageNet是一个拥有超过1500万张带标签的高清图片的数据集，这些图片大约属于2.2万个类别。这些图片收集自网络并由亚马逊的Turk群智工具进行人工标记。从2010年开始，作为帕斯卡物体可视化挑战的一部分，一项被称为ILSVRC的比赛每年都会进行。

ILSVRC使用ImageNet的一个子集，这个子集包含大约1000个类别，每个类别大概包涵1000张图。总共大概有120万张训练图片，5万张验证图片和15万张测试图片。

ImageNet Classfication with Deep Convolutional Neural Networks

中文翻译在：http://blog.csdn.net/motianchi/article/details/50851074

这篇文章训练了一个大型深度卷积神经网络来将ImageNet LSVRC-2010数据集中的120万张高清图片分到1000个不同的类别中。提出的模型就是著名的AlexNet。

AlexNet：共有8个学习层——五个卷积层3个全连接层。

卷积和池化操作的深入理解在：http://blog.csdn.net/u010402786/article/details/51541465

关于Dropout技巧的具体理解在：http://mt.sohu.com/20170306/n482526847.shtml

Going Deeper with Convolutions

中文翻译在：http://blog.csdn.net/motianchi/article/details/50970136

这是Google公司基于ImageNet的ILSVRC比赛做的识别图像的深度卷积神经网——深达22层的Inception实例GoogLeNet《Going Deeper with Convolutions》。

这篇文章提出了一个名为“Inception”的深度卷积神经网结构，其目标是将分类、识别ILSVRC14数据集的技术水平提高一个层次。这一结构的主要特征是对网络内部计算资源的利用进行了优化。

关于goolgenet的讲解：
http://blog.csdn.net/shuzfan/article/details/50738394 http://blog.csdn.net/stdcoutzyx/article/details/40759903
关于系统的细节实现：
http://www.cnblogs.com/gkwang/p/4625410.html
疑问：
http://blog.csdn.net/Buyi_Shizi/article/details/53409536
--->梯度和稀疏性的疑问

GoogleNet学习心得
http://www.cnblogs.com/Allen-rg/p/5833919.html
卷积神经网络简介：
http://www.36dsj.com/archives/24006

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航