您的位置:首页 > 其它

SegNet-论文笔记-理解

2017-12-09 16:51 183 查看
论文:SegNet: A Deep Convolutional Encoder-Decoder Architecture for Robust

Semantic Pixel-Wise Labelling

翻译:http://blog.csdn.net/u014451076/article/details/70741629

理解参考:http://blog.csdn.net/fate_fjh/article/details/53467948

Demo:http://mi.eng.cam.ac.uk/projects/segnet/

核心技术:

总体结构:



感觉其实和FCN思路十分相似,只是Encoder,Decoder(Upsampling)使用的技术不一致.此外SegNet的编码器部分使用的是VGG16的前13层卷积网络,每个编码器层都对应一个解码器层,最终解码器的输出被送入soft-max分类器以独立的为每个像素产生类概率.

每个编码器由数个蓝色层(卷积层,批归一化层,RELU层)以及一个Pooling层(2x2窗口,步进2,最大池化)组成,输出相当于系数为2的下采样.由于最大池化和子采样的叠加,导致边界细节损失增大,因此必须在编码特征图中在sub-sampling之前捕获和储存边界信息.为了高效,文中只储存了max-pooling indices.

突出贡献:

分割的精度略好于FCN,总体效率也比FCN略高,
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  SegNet