您的位置：首页 > 理论基础 > 计算机网络

CNN网络结构 - Refining Architectures of Deep Convolutional Neural Networks

2016-10-28 15:58 447 查看

CVPR 2016

Refining Architectures of Deep Convolutional Neural Networks

本文的出发点是回答下面的问题: is the selected CNN optimal for the dataset in terms of accuracy and model size?

针对一个现有的多类别数据集，使用CNN进行分类，那么我们选择的CNN 模型在精度和模型大小上是否是最优的？

Given a pre-trained CNN for a specific dataset, refine the architecture in order to potentially increase the accuracy while possibly reducing the model size

这里我们定义了两个操作方法来调整模型使其最优。

Intuition behind our approach: 给定一个数据集，固定网络的深度，怎么最好的区分数据集上的类别？我们的方法首先从一个预训练好的CNN模型开始，然后学习该数据集中所有类在每一个卷积层上的区分度。基于数据集的属性，数据集中某一些类在较低的卷积层区分度较好，另一些类在较低的卷积层区分度则较低。类似的波动在较高的卷积层也可以被发现。和给定层的前一层相比较，该给定层对某些类可以增加区分，对另些类可以降低区分。区分度增加的类的数目和增加该层的神经元个数有关（ stretching / widening）；区分度降低的类的数目和对称切分该层的神经元有关（ symmetric splitting）。所以 stretch and split操作可以同时应用于每一卷积层。stretch 或 split 的多少不仅取决于对当前层类别区分能力的影响，还取决于对其后续层的类别区分度影响。当 stretch and split 的操作固定下来后，我们可以调整网络，在相同的数据集上重新训练。

结果对比：

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航