转自
背景
- 论文1:Rich feature hierarchies for accurate object detection and semantic segmentation
- 论文2:Fast R-CNN
- 论文3:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
小结
RCNN
- 在图像中确定约1000-2000个候选框 (使用选择性搜索Selective Search,根据颜色,纹理啥的得到候选框)
- 每个候选框内图像块缩放至相同大小,并输入到CNN内进行特征提取
- 对候选框中提取出的特征,使用分类器判别是否属于一个特定类
- 对于属于某一特征的候选框,用回归器进一步调整其位置
Fast R-CNN
- 在图像中确定约1000-2000个候选框 (使用选择性搜索Selective Search)
- 对整张图片输进CNN,得到feature map
- 找到每个候选框在feature map上的映射patch,将此patch作为每个候选框的卷积特征输入到SPP layer和之后的层
- 对候选框中提取出的特征,使用分类器判别是否属于一个特定类
- 对于属于某一特征的候选框,用回归器进一步调整其位置
Faster R-CNN
- 对整张图片输进CNN,得到feature map
- 卷积特征输入到RPN,得到候选框的特征信息
- 对候选框中提取出的特征,使用分类器判别是否属于一个特定类
- 对于属于某一特征的候选框,用回归器进一步调整其位置