内容纲要
提取domain无关的特征在无监督域适应中很重要。因为目标标签不可取,所以无法保证域无关的特征对于目标域中的实例也实用。我们拓展了经典的测地线流核方法,利用训练过程的伪标签进行无监督的预适应。
SGK包含了所有的两个域之间的subspace,对噪声不敏感,然而由于缺少目标域的先验知识,很难确保特征空间在目标任务中也是有区分度的。
为了解决这个问题,我们提出D-GFK,考虑了域无关的表达和几何关系来重建RKHS。提出的方法旨在通过几何关系,引导测地线流核学习到一个类区分度的方向,这是在无监督预适应中是一个关键的先验。提出的D-GFK使用两步:
第一步:学习测地线流。
第二步:学习目标的基点,首先通过图方法获得伪标签,然后使用它们生成一组新的目标基向量,更有助于分类。
Label propagation with the kernel transition matrix
定义了两个无穷的嵌入空间的高斯距离:
其中σ为尺度参数,控制住迁移概率。然后标签:
H为概率过度矩阵,每个元素表示上述的h。其中L可以收敛到固定的数量的点,然后使用部分最小而成来得到目标的类相关的基。
总体的算法过程:
这篇论文就是求一个很好的基。
那么问题又来了。流形怎么定义。经过PCA降维后的曲面都是流形吗?
留言