R-CNN系列相关总结（转）

发表于 2018-05-24 | 分类于 paper | 热度: ℃

字数统计: 392字 | 阅读时长 ≈ 2分钟

转自

一文读懂：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

背景

论文1：Rich feature hierarchies for accurate object detection and semantic segmentation
论文2：Fast R-CNN
论文3：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

小结

RCNN

在图像中确定约1000-2000个候选框 (使用选择性搜索Selective Search,根据颜色，纹理啥的得到候选框)
每个候选框内图像块缩放至相同大小，并输入到CNN内进行特征提取
对候选框中提取出的特征，使用分类器判别是否属于一个特定类
对于属于某一特征的候选框，用回归器进一步调整其位置

Fast R-CNN

在图像中确定约1000-2000个候选框 (使用选择性搜索Selective Search)
对整张图片输进CNN，得到feature map
找到每个候选框在feature map上的映射patch，将此patch作为每个候选框的卷积特征输入到SPP layer和之后的层
对候选框中提取出的特征，使用分类器判别是否属于一个特定类
对于属于某一特征的候选框，用回归器进一步调整其位置

Faster R-CNN

对整张图片输进CNN，得到feature map
卷积特征输入到RPN，得到候选框的特征信息
对候选框中提取出的特征，使用分类器判别是否属于一个特定类
对于属于某一特征的候选框，用回归器进一步调整其位置

分享到：收藏夹复制网址邮件微信 QQ空间腾讯微博豆瓣一键分享更多