内容纲要

论文的工作包括三个:

  1. 新颖的嵌入结构,来编码空间结构关系,使用胶囊网络。
  2. 一个新颖的triplet损失。
  3. 一个有效的非参数化分类器项。

Introduction

当前研究存在的问题:

  1. PN生成的特征嵌入,对方向敏感,不能很好的考虑空间关系
  2. PN把输出度量空间分成不连接的多边形,其中多边形中的任意一个点的最邻近点作为这个多边形的pivot,这样会太粗糙,很容易受噪声的影响,因此不能保证prototype的可区分度和鉴别度。
  3. 简单的距离分类器会被异常点严重影响,特别是当少样本情况。

从上面讨论中,作者以此提出改进方法,如文中开头所说。网络包含两个组件:

  1. 胶囊网络用来生成特征表达,较少无关的噪声信息。
  2. 一个提升的非参数化分类机制,使用attentive prototype,通过聚合注意力获得,其中权重是通过重建损失计算。是query-depended的
  3. 网络通过triplet-like损失训练。
  4. 我们进一步提出半监督难例挖掘技术来次啊杨困难的triplet,加速收敛和训练过程。

Methods

首先是介绍DeepcCaps, 然后介绍网络结构

embedding module

file

Attentive prototype

file
file
上面俩是常用的分类器,但是容易收到噪声和异常点的影响。作者基于local mean classifier提出一个改进的算法来解决异常点问题。给定同一个类别中的所有类,我们计算他们对于query样本的重建误差,然后用作甲醛的平均prototype。这个新的prototype聚合了所有实例的信息。new prototype和query样本之间的重建误差不仅提供了可区分度的判别,同时重做分类的可信度。
具体而言,对于k个样本,对于query实例q,通过应用归一化的高斯函数,定义成员变量:
file
其中,xij是类别i的第j个样本,σ为高斯的宽度,我们设定σ为0.1.然后对所有的类别i,我们计算注意力的prototype:
file
这样得到的q可以被认为是从类别i重建的query样本q,这里我们期望q趋向得到的正样本而远离负样本。
file
这样得到的损失函数为:
file
对于图像分类而言,query图像类别的标签为:
file

Improved Triplet-like loss

原始的triplet损失只有一个负的样本,对于每次更新,忍忍骂我们通常需要比较query图像和其他多个不同类别的。因此,triplet损失困难不够有效,特别是少样本设置。受其他当发启发,我们使用E负样本prototype允许同步比较。具体上,我们suicide算则E个负样本prototype组成一组triplet:
file
与传统的三重态损失相比,我们改进的类三重态损失中的每个前向更新都包含更多的类间差异,因此使学习的特征嵌入对于不同类的样本更具区分性。

Minin Hrad Triplet

使用triplet训练,很容易停滞,是哪位当模型开始收敛,嵌入空间学习如何正确的映射triples,因此大多数triples满足margin而对梯度不再有贡献。为了加速收敛,我们提出一个hard-triplet挖掘机制来采样最具有信息量的难的triplets。具体而言,首先上述随机选择,然后加测采样的triples是否满足margin,满足的化会剔除。

Result

file
由于backbone不是resnet,无法对比算法的优劣性。但是仍然有可借鉴的地方:关于prototype的计算,利用query样本和suppor样本之间的交叉验证,减少异常点的影响。并重建query样本的特征,最后引入triplet损失。

最后修改日期: 2020年10月21日

作者

留言

撰写回覆或留言

发布留言必须填写的电子邮件地址不会公开。