文章目录
- 1、多尺度图像预测
- 2、金字塔特征预测
-
- 2.1 FPN
- 2.2 SSD
- 3、bounding box设计
1、多尺度图像预测
将图片进行不同尺度的缩放,得到图像金字塔,然后对每层图片提取不同尺度的特征,得到特征图。最后对每个尺度的特征都进行单独的预测。
特点:不同尺度的特征都可以包含很丰富的语义信息,精度高 ,但 速度慢。
2、金字塔特征预测
将输入图片转变成feature map,在feature map层面上来进行尺度变化,采用不同 的方法进行不同尺度 特征的融合,以实现多尺度检测。
2.1 FPN
特征金字塔网络:将低层的特征和高层的特征融合起来,在不同的特征层都单独进行预测。
2.2 SSD
从网络不同层抽取不同尺度的特征,然后在这不同尺度的特征上分别进行预测。低层的特征对于小物体检测比较有效。
3、bounding box设计
利用RPN网络生成不同尺度的anchor,实现 多尺度目标检测。faster RCNN 和 SSD都用到了这方法。
faster rcnn中 RPN 从单个feature map上面预测,是二分类(是|不是目标);SSD中 RPN从多个特征图上面预测,是(N+1)分类(N个类别+1个背景)。
(b) 对应 Faster R-CNN, (c ) 对应 SSD, (d) 对应 FPN
参考:https://www.zhihu.com/question/309488424
https://www.zhihu.com/question/309488424