这是博主自己读论文的笔记哦,原文请在Automated melanoma recognition in dermoscopy images via very deep residual networks下载~
解决的问题:
- 皮肤黑色素瘤与非黑色素瘤的分类
面临的挑战
- 医学图像数据有限
- 医学图像分类中类别间的差异比自然图像小得多
- 比如黑色素瘤与非黑色素瘤之前的差异比人与汽车的差异小得多。
创新点(其实也是论文大概的思路~)
- 设计了使用超过50层的网络,因此比较深的网络可以学习到更有判别力的表示
- 很深的网络往往面临性能退化和过拟合的问题,本文引入残差学习的方法避免此问题
- 构建FCRN全卷机残差网络对病灶进行分割,结合下采样过程中产生的多尺度特征以避免在上采样过程中的信息丢失
- 将FCRN和其他的深度残差网络结合起来形成一个两阶段框架,该框架中分类网络使用分割的结果来学习,从而可以学习到更有代表性和具体的特征,而不是直接使用整个皮肤镜图像,这样减轻了训练数据的不足
模型
1. Background on Very Deep Residual Networks
- 网络深度是影响模型表达能力的关键因素,增加网络深度可以实现性能提升,本文使用较深的网络
- 但是随着网络加深,网络性能会饱和甚至退化,还会有梯度消失和过拟合的问题
- 本文引入残差学习的方法解决以上问题,通过跳层连接改善网络内的信息流,将input和跳层连接的输入结合起来重构网络层。
2. FCRN for Skin Lesion Segmentation
- 本文将原始FCRN的下采样改为了上采样,又用反卷积代替上采样,使得输出图像与原始图像大小相等,用于分割
- 由于反卷积过程只是利用了上一层学习到的最终特征而没有充分利用网络中低级别的空间信息,导致预测结果忽略了一些局部信息
- 本文将多尺度上下信息整合到FCRN中,具体做法是将下采样过程中不同尺度的特征整合到对应的上采样过程中
3. DRN for Skin Lesion Classification
两阶段框架:
-
动机:样本中病灶区域占整体图像的比例是不同的,这个比例的变动会影响模型的性能
-
本文首先利用FCRN网络对皮肤镜图像进行分割,resize到input的固定大小,再放入分类网络
-
分类网络由很深的残差网络构成,与FCRN中的下采样网络结构基本相同
-
利用7*7的平均下采样紧跟残差块来提取全局深度残差特征,同时取两个分类器(Softmax classifier和SVM)的平均来获得最终分类结果