guodong's blog

master@zhejiang university
   

论文阅读:FreeAnchor: Learning to Match Anchors for Visual Object Detection,NIPS2019

文章链接:https://arxiv.org/abs/1909.02466

有源码:https://github.com/zhangxiaosong18/FreeAnchor

首先,为了得到高的召回率,检测器需要确保每个目标至少有一个预测的anchor和ground truth 接近。第二,为了得到较高的准确率,检测器需要将有着poor位置的anchor分类为背景(较大的边界框回归误差)。第三,anchor的预测应该和NMS过程兼容,也就是,分类得分越高,位置也就越精确。

为了实现这些目标,将objects-anchor匹配过程,公式化为最大似然估计(MLE),该过程从每个对象的“一包”锚中选择最具代表性的锚,并将每个锚包的似然概率定义为锚包中最大的锚置信度。最大化似然概率可确保至少存在一个对对象分类和定位具有较高置信度的锚,同时,大多数分类或定位误差较大的锚会被分类为背景。在训练时,似然概率被转换为损失函数,然后可以基于CNN的探测器训练和对象锚匹配。

如上图所示,顶部为需要手动指定anchor的框架,底部为FreeAnchor,它允许每个目标在一包anchor里都灵活匹配最好的anchor。

整个算法框架

其中,损失函数:

其中第一项为召回率:

用来选择anchor。当开始时训练不足,xi都很小,此时mean-max接近平均值,意味着几乎每个anchor都参与了训练,当训练充足时,此时mean-max函数接近max函数,意味着得分最高的anchor参与训练。

第二项为准确率:FL为focal loss,

 意味着anchor aj 不是目标的匹配。

意味着anchor aj正确预测bi

为了和NMS兼容的饱和线性公式。

在coco上的检测结果:

“ FreeAnchor *”是指将尺度范围从[640,800]扩展到[480,960]。

“ FreeAnchor **”进一步在{480、640、800、960、1120、1280}规模上使用了多尺度测试。




上一篇:
下一篇:

头像

guodong

没有评论


你先离开吧:)



发表评论

电子邮件地址不会被公开。 必填项已用*标注