当前位置: 代码迷 >> 综合 >> 【论文浅读】《Weakly Supervised Attention Pyramid Convolutional Neural Network for Fine-Grained Visual Cla》
  详细解决方案

【论文浅读】《Weakly Supervised Attention Pyramid Convolutional Neural Network for Fine-Grained Visual Cla》

热度:122   发布时间:2023-09-26 23:06:43.0

创新思想:

文章提出了Attention Pyramid Convolutional Neural Network (AP-CNN) 注意金字塔卷积神经网络,提高了对对象子类分类的效率。该网络主要分为两大部分Attention Pyramid和ROI Pyramid:

Attention Pyramid:注意金字塔;top-down高层语意、bottom-up低层特征;

ROI Pyramid:感兴趣区域导向金字塔;dropblock细化特征、zoom-in消除噪声。

主要原理:

【论文浅读】《Weakly Supervised Attention Pyramid Convolutional Neural Network for Fine-Grained Visual Cla》
整体结构:(a)(b)Attention Pyramid和?ROI Pyramid。
【论文浅读】《Weakly Supervised Attention Pyramid Convolutional Neural Network for Fine-Grained Visual Cla》
Attention Pyramid结构:
(a) spatial attention pyramid:通过反卷积获取低层特征;
(b) channel attention pathway:通过池化和两次激活获取高层语意;

【论文浅读】《Weakly Supervised Attention Pyramid Convolutional Neural Network for Fine-Grained Visual Cla》
(b) channel attention pathway中的池化激活公式表达式。
【论文浅读】《Weakly Supervised Attention Pyramid Convolutional Neural Network for Fine-Grained Visual Cla》
ROI Pyramid示意图:
灰色dropblock:通过随机丢弃一些特征块,降低过拟合,细化特征;
黑框zoom-in:放大有效区域,消除噪声。

主要实验结果:

【论文浅读】《Weakly Supervised Attention Pyramid Convolutional Neural Network for Fine-Grained Visual Cla》
用了AP的金字塔网络的正确率比不用金字塔和只用特征金字塔的要高。
【论文浅读】《Weakly Supervised Attention Pyramid Convolutional Neural Network for Fine-Grained Visual Cla》
对比不同AP,其中:
C: Channel attention;
S: Spatial attention;
SP: Bottom-up spatial attention pathway;
CP: Bottom-up channel attention pathway;
【论文浅读】《Weakly Supervised Attention Pyramid Convolutional Neural Network for Fine-Grained Visual Cla》
对比ROI是否启用dropblock和zoom-in的正确率。

【论文浅读】《Weakly Supervised Attention Pyramid Convolutional Neural Network for Fine-Grained Visual Cla》
三个数据集的效果展示。

算法

【论文浅读】《Weakly Supervised Attention Pyramid Convolutional Neural Network for Fine-Grained Visual Cla》

  相关解决方案