Automatic Feature Learning for Glaucoma Detection Based on Deep Learning论文理解
2017-10-27 21:09
633 查看
本文提出了基于DeepLearnINg的自动特征学习为青光眼检测,不同于传统的卷积神经网络,本文采用的网络嵌入了微型神经网络(多层感知器)有更复杂的结构去抽象感知区域的数据;此外提出了一种上下文深度学习结构来获得眼底图像的分层表示以区分青光眼和非青光眼模式,这里网络采用其他CNN网络的输出作为此网络的上下文特征来提升青光眼检测的性能。本文采用的方法在ARIGA和SCES数据上进行测试,同时取得了最先进的性能。
1
引言
本文网络架构的特色:(1)网络的卷积层采用多层感知器去卷积输入图像(这种类型的层结构能够更好地从局部图像块中提取特征)(2)不同于传统的CNN,本文提出了一种上下文训练策略用来提取青光眼深层的隐层特征(3)这种context负责动态调整CNN模型的学习(有效利用
通过将一个CNN的输出作为另一个网络的context来提高青光眼检测)
2
方法
2.1
基于深度卷积神经网络的特征学习
该网络框架的组成:5个多层感知卷积层、一个全连接层。同时响应归一化层和重叠层也被应用于我们提出的网络中。
卷积层:
多层感知卷积层:
当没有关于潜在数据的分布的先验知识时,希望使用通用函数近似器来进行局部图像块的特征提取,因为它是能够逼近潜在特征的更抽象的表示。径向基网络和多层感知器是两个众所周知的通用函数逼近器。在提出的DL中使用多层感知器有两个原因架构:首先,多层感知器与使用使用反向传播训练的卷积神经网络结构兼容;第二,多层感知器可以是一个深层次的模型本身,这个特征重用的思想一致。这种类型的层在本文中表示为mlpconv,这里我们采用MLP取代GLM来卷积输入,Relu作为激活函数,mlpconv层进行计算的公式可用2和3式来表示。
Contextualizing
训练策略
与传统的独立训练神经网络的CNN不同,本文采用contextualizing训练我们提出的DL架构,其中整个深CNN被称为contextualized卷积神经网络(C-CNN)。
4000
对于CNN训练,我们采取一个已训练的CNN的输出作为自己全连接层的context输入。这个context有责任调整CNN模型的学习,从而实现了contextualized卷积神经网络。 如图1所示,CNN2通过上述C-CNN策略训练,将CNN1的卷积层输出作为自己完全连接层的context输入。
C-CNN包括五个多层感知器卷积层CNN1和全部的CNN2网络。青光眼的预测结果来自CNN2的soft-max分类器。
2.2
青光眼分类
Disc
分割:
由于optic disc是青光眼诊断的主要区域,disc图像是我们提出的C-CNN的输入图像。因此需要从视网膜眼底图像中首先分割出disc区域,我们采用文献19中模板匹配的方法分割disc区域。所采用的disc分割方法基于周边萎缩消除,其中通过边缘滤波进行消除,约束椭圆霍夫变换和周边萎缩检测。然后将分割的disc图像下采样到256×256的固定分辨率。最后,减去optic图像中所有像素的平均值来消除图像之间的照明变化的影响。
Dropout和数据扩充
为了减少对图像数据的过度拟合,我们采用数据扩充人工放大数据集。Dropout包括将每个隐藏神经元的输出以0.5的概率设置为零[16]。在测试期间,我们使用所有的神经元,但它们的输出乘以0.5。数据扩充包括生成图像翻译和水平翻转。在训练时,我们通过在256×256图像中提取随机的224×224个图像块(包括它们的水平翻转)来执行数据增加。在测试时,CNN通过在256×256图像和翻转的图像中提取四角和中心的图像块即10个224×224个图像块,然后采用softmax层对其进行预测,最后结果做平均来实现预测。
softmax回归层的自动分类
这里可以认为是logistics
回归层
3
实验
为了评估本文提出的C-CNN方法的性能,这里在两种数据集上进行实验ORIGA和SCES;
我们将本文的方法和最先进的基于重建/像素点的/滑动窗的/超像素的方法进行对比,同时,我们使用IOP和CDR以及不同CNN类型的结构进行对比。
表1中模型解释
3.1
实验准则
3.2
实验设置
实验具体的设置和文献7中的一致,ORIGA数据集由168例青光眼和482例正常图片;SCES数据集有1676例图片,其中46例为青光眼图片。
相关文章推荐
- 论文阅读之:Deep Meta Learning for Real-Time Visual Tracking based on Target-Specific Feature Space
- An Automatic Detection Scheme for Periodic Signals Based on Spectrum Analyzer Measurements 导读
- 论文阅读:BoVW-MI:TASK DRIVEN DICTIONARY LEARNING BASED ON MUTUAL INFORMATION FOR MEDICAL IMAGE CLASSIFIC
- 论文阅读理解 - Deep Learning of Binary Hash Codes for Fast Image Retrieval
- 【论文笔记】Margin Sample Mining Loss: A Deep Learning Based Method for Person Re-identification
- 论文笔记之---Learning Deep Feature Representations with Domain Guided Dropout for Person Re-identificatio
- 论文阅读理解 - Deep Metric Learning via Lifted Structured Feature Embedding
- 论文阅读理解 - Learning Feature Pyramids for Human Pose Estimation
- 论文研读--Learning Deep Feature Representations with Domain Guided Dropout for Person Re-identification
- 论文笔记之---Joint Detection and Identification Feature Learning for Person Search
- 论文复现报告:Deep Region and Multi-label Learning for Facial Action Unit Detection
- 论文阅读理解 - Deep Metric Learning via Lifted Structured Feature Embedding
- 论文笔记 A Large Contextual Dataset for Classification,Detection and Counting of Cars with Deep Learning
- Deep Learning for Content-Based Image Retrival:A Comprehensive Study 论文笔记
- Deep Region and Multi-label Learning for Facial Action Unit Detection简要论文笔记
- 论文泛读 A Novel Ensemble Learning-based Approach for Click Fraud Detection in Mobile Advertising [1/10]
- Joint Deep Learning For Pedestrian Detection(论文笔记-深度学习:行人检测)
- 1604.Joint Detection and Identification Feature Learning for Person Search论文阅读笔记
- 深度学习论文理解2:on random weights and unsupervised feature learning
- (论文笔记)Deep Learning Strong Parts for Pedestrian Detection