您的位置：首页 > 其它

【论文阅读笔记】ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classif

2018-02-02 11:27 441 查看

CVPR2017 paper

文用自然语言处理和深度卷积神经网络处理临床胸片，从中判别和定位8中胸部疾病：

1.Introduction

文章introduction部分就提出现在做深度医学分析的一个主要问题就是数据量小，不能满足大数据分析的要求，因此模型分析结果的泛化能力其实不能保证。因此本文采用了自建的数据库，“ChestX-ray8”，包含了从1992-2015年的32717幅胸片中的108948幅正面胸片。难得的是这些影响学数据已经公开，翻墙登录https://nihcc.app.box.com/v/ChestXray-NIHCC可以下载，更多数据库细节可以看https://www.cc.nih.gov/drd/summers.html。

2.ChestX-ray8的构建

基于NLP对胸片报告进行自动挖掘分析，先使用NLTK进行处理，将报告转变为句子，然后用Bllip Parser对句子进行解析，从中分析出报告中指出的疾病种类。文中还使用了两类挖掘影像学报告中的病理的工具：DNORM和MetaMap。通过挖掘病理报告，生成的8类疾病的关系图，其中有很多疾病不是单一存在，也就是说一张X光图，可能同时关联多种疾病，是一个多分类任务。

3.检测模型

文章中提出一种Weakly-Supervised PathologyLocalization，使用了经典CNN模型结构及其中大部分卷积层的权重参数，对经典模型中的全连接层进行了移除，加入了Transition Layer和全局Pooling Layer，样本的标记采用专家和NLP处理检测报告得到。Transition Layer主要用于将经典DCNN中训练过来的特征图转换为统一得格式。

全局池化层中使用Log-Sum-Exp (LSE) pooling，文中说这种Polling是max-pooling和average-pooling的过渡状态，通过超参数r来控制偏向MAX还是average，其中S=s*s时候S区域内
总的小区域。

损失函数层加在网络最后，没有采用常用的欧拉损失或者交叉熵损失，采用的是the
weighted CEL (W-CEL)。

4.实验结果
训练采用Caffe和装有4块Titan X GPU的Linux Server，从实验结果看，采用ResNet-50预训练，r=10的Global Pooling以及W-CEL测试效果较好，但结果中对于胸片病理中包含小物体如结节，或者肺炎等样本数较少的病例，效果还不太好。文中也提出更大的标注数据量对于提升模型准确性的重要性。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航