当前位置: 代码迷 >> 综合 >> (四十三):Comprehensive Linguistic-Visual Composition Network for Image Retrieval
  详细解决方案

(四十三):Comprehensive Linguistic-Visual Composition Network for Image Retrieval

热度:95   发布时间:2023-11-17 07:42:33.0

(四十三):Comprehensive Linguistic-Visual Composition Network for Image Retrieval

  • 手写笔记

  • 出处: SIGIR 2021: 1369-1378
  • 主要内容:细粒度的局部组合和全局组合(图像与文本的分别做注意力),以及互相学习、相互增强的模块。

手写笔记

请添加图片描述

请添加图片描述

  相关解决方案