本文是我的目标检测笔记的第二部分:Anchor-Based经典检测模型分析,包括对以下经典的目标检测模型的个人总结和理解:
- Faster R-CNN
- YOLO 系列
- SSD
总述
下图显示了不同算法的基本框架图,对于Faster R-CNN,其先通过CNN得到候选框,然后再进行分类与回归,而Yolo与SSD可以一步到位完成检测。
Faster R-CNN
Faster R-CNN是two-stage检测框架的代表作,在各大竞赛的排行榜上,以它为基础的变体都占据着统治地位。Faster R-CNN的网络结构图如下图:
按照流程来说,Faster R-CNN的整体架构可以看下图(以VGG为例):
Faster R-CNN的检测流程是:首先使用深度卷积网络作为Backbone,从原始图像中抽取一张特征图;随后根据RPN输出的候选区域截取主干网络输出的特征图;之后通过RoI pooling得到最终的Head,并进行bounding box regressio