创新思想:
文章提出了Attention Pyramid Convolutional Neural Network (AP-CNN) 注意金字塔卷积神经网络,提高了对对象子类分类的效率。该网络主要分为两大部分Attention Pyramid和ROI Pyramid:
Attention Pyramid:注意金字塔;top-down高层语意、bottom-up低层特征;
ROI Pyramid:感兴趣区域导向金字塔;dropblock细化特征、zoom-in消除噪声。
主要原理:
整体结构:(a)(b)Attention Pyramid和?ROI Pyramid。
Attention Pyramid结构:
(a) spatial attention pyramid:通过反卷积获取低层特征;
(b) channel attention pathway:通过池化和两次激活获取高层语意;
(b) channel attention pathway中的池化激活公式表达式。
ROI Pyramid示意图:
灰色dropblock:通过随机丢弃一些特征块,降低过拟合,细化特征;
黑框zoom-in:放大有效区域,消除噪声。
主要实验结果:
用了AP的金字塔网络的正确率比不用金字塔和只用特征金字塔的要高。
对比不同AP,其中:
C: Channel attention;
S: Spatial attention;
SP: Bottom-up spatial attention pathway;
CP: Bottom-up channel attention pathway;
对比ROI是否启用dropblock和zoom-in的正确率。
三个数据集的效果展示。