论文
Towards Discriminative Representation Learning for Unsupervised Person
Re-identification
接收单位:iccv2021
主要贡献
- CCL:本质是对比损失,正负样本取值有些不同
- PDA:优化了损失函数,渐进式的在训练过程中随着epoch的增加减少源域的loss权重增加目标域的loss权重
- FA:引入傅里叶增强的方式,对提取的特征使用傅里叶增强然后计算CE分类损失
CCL
- ?θ:MMA更新的网络参数?θ ← m?θ + (1-m) θ
- fθ:参数为θ的编码网络
- xt:当前选中的样本
- xtp:当前选中的样本在当前batch中的正样本
- xtn:Dynamic Queue中存的以往的样本特征,将当前选中样本那个类剔除其他的作为负样本
CCL与其他对比损失比较:
PDA
首先损失函数:
- λ为权重,s和t分别对应源域和目标域
- L为损失,s和t分别对应源域和目标域
- e为第几个epoch
作者提出的λ权重变化策略:
阶跃形示例图:
总而言之,前期损失的权重源域高,后期损失的权重目标域高。
FA
首先看一个FFT的蝶图计算示例图:
简单起见不管中间怎么计算,看图可以知道输入实数s(n)根据蝶图可以得到对应的虚数,并且输入8个实数输出也是8个虚数,因此作者利用FFT对网络编码的图片特征计算对应的虚数,然后对该虚数计算振幅(例如:虚数a=3+4j振幅为(3^2 + 4^2) ^ 0.5 = 5)。通过这样的计算相当于对cnn网络编码的特征进行了一个数据增强(作者叫这个傅里叶增强),作者利用这个增强的特征再计算了一个分类损失。
傅里叶计算增强特征:
完整增强公式:
作者的实验证明这样有效,并且优于常用的FC层:
可视化加入FA的效果(将不同类更好的分开了):
效果