内容纲要
1、简介
目标检测在多尺度尤其是小目标的检测上都是一个很大的挑战,我们可以使用金字塔模型的网络在同一张图片上来检测,如下图
但是处理那么多尺度的图片和卷积层会消耗大量的时间和内存,以致于几乎不能实现。因此我们可以换个思路,创造一个特征金字塔使用他们来进行目标检测,如下图。
但是底层的feature map对目标检测起的作用不是很大。于是FPN就考虑了这两点,同时提高精确度和速度,它代替了faster r-cnn里特征提取层,同时生成了多尺度高质量的feature map,如下图
2、数据流向
FPN包括两个数据流向,一个是从底往上,还有一个是从顶往下。前者就是通常的卷积操作,用来提取特征,空间分辨率也越来越低,语义价值越来越高。SSD是从多尺度的feature map做检测,然而底层的特征却没有被用到检测。他们有高分辨率但语义价值不是足够高,还会降低检测速度,所以SSD只用高层来检测,导致对小目标检测效果很差。
参看https://medium.com/@jonathan_hui/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c
留言