多尺度（multi-scale）目标检测方法_综合

文章目录

1、多尺度图像预测
2、金字塔特征预测
- 2.1 FPN
- 2.2 SSD
3、bounding box设计

1、多尺度图像预测

将图片进行不同尺度的缩放，得到图像金字塔，然后对每层图片提取不同尺度的特征，得到特征图。最后对每个尺度的特征都进行单独的预测。
特点：不同尺度的特征都可以包含很丰富的语义信息，精度高，但速度慢。

2、金字塔特征预测

将输入图片转变成feature map，在feature map层面上来进行尺度变化，采用不同的方法进行不同尺度特征的融合，以实现多尺度检测。

2.1 FPN

特征金字塔网络：将低层的特征和高层的特征融合起来，在不同的特征层都单独进行预测。

2.2 SSD

从网络不同层抽取不同尺度的特征，然后在这不同尺度的特征上分别进行预测。低层的特征对于小物体检测比较有效。

3、bounding box设计

利用RPN网络生成不同尺度的anchor，实现多尺度目标检测。faster RCNN 和 SSD都用到了这方法。
faster rcnn中 RPN 从单个feature map上面预测，是二分类（是|不是目标）；SSD中 RPN从多个特征图上面预测，是（N+1）分类（N个类别+1个背景）。
在这里插入图片描述
(b) 对应 Faster R-CNN， (c ) 对应 SSD， (d) 对应 FPN

参考：https://www.zhihu.com/question/309488424
https://www.zhihu.com/question/309488424