论文名称:Visible thermal person re-identification via dual-constrained top-ranking
出处:2018 IJCAI
文章目录
- 1. 摘要
- 2. 网络框架
- 3. 损失
- 4. 实验结果
1. 摘要
解决跨模态信息匹配的常用手段就是将不同模态的信息映射到相同的特征空间中,这样就可以将它们等同对待,用同一种度量手段去度量它们之间的相似性。跨模态reid现有的工作,主要关注学习共享特征表示来处理交叉模态差异。本文提出了一种具有双向双约束顶级损失(bi-directional dual-constrained top-ranking loss
)的双路径网络(a dual-path network
)来学习判别特征表示。优点在两个方面:① 直接从数据中端到端学习,而无需执行额外的度量学习步骤。② 它同时处理交叉模态和模态内的变化,以确保学习表示的辨别性。同时,进一步结合身份损失来建模身份特定信息,以处理大的类内变化。
2. 网络框架
这个双路径网络包含特征提取器和特征嵌入两个部分。前者提取每个模态内的特定信息;后者学习一个多模态的共享空间来减少模态差异。如下图,FCN采用在ImageNet预训练的AlexNet (conv1 ? conv5),FC1(4096),BN,FC2共享的全连接层(1024)。
3. 损失
The bi-directional ranking loss:包含两种关系:visible to thermal triplet
(one anchor visible image, two thermal images)、thermal to visible triplet
(one anchor thermal image, two visible images)
Cross-modality Top-Ranking Constraint:对上面的 loss 进行改进,比较一个正样本对和所有负样本对的最小值。有两个重要的优势:① 确保了最近的跨模态负样本对远离最远的交叉模态正样本,从而有助于减少跨模态的变化,保留较高的可辨别性。② 双向训练策略确保了学习到的特征表示是模态不变的。它提高了对不同查询设置的鲁棒性。
Intra-modality Top-Ranking Constraint:为减少模态内部由于姿势视角等引起的差异,引入模态内部损失。三元组中除了参考样本之外,其余两个样本在同一个模态但是属于不同的身份,所以两者之间的距离也应该大于一个margin。
The final loss function
值得注意:在每次迭代中首先随机选择N个人的身份,其中N是批处理大小。然后从两种不同的模式中随机选择所选身份的一个可见图像和一个热图像来构建最小批( 2*N个样本)。那么,对于每个ID,正样本对只有一个,负样本对有N-1个。
4. 实验结果
论文程序使用tensorflow框架实现,将权衡参数设置为λ1=0.1和λ2=1。margin ρ1设置为0.5,而ρ2设置为0.1。