当前位置: 代码迷 >> 综合 >> [CVPR2020] XDCycleGAN
  详细解决方案

[CVPR2020] XDCycleGAN

热度:85   发布时间:2024-03-09 23:51:25.0

[CVPR2020] Augmenting Colonoscopy using Extended and Directional CycleGAN for Lossy Image Translation

      • 背景
      • 主要贡献
      • Extended Cycle Consistent Loss
      • Directional Discriminator

背景

本文提出Extended and Directional CycleGAN (XDCycleGAN),用于在OC和VC之间进行有损不成对图像翻译
光学结肠镜检查(OC):主要包含几何结构+颜色+纹理+镜面高光信息
虚拟结肠镜检查(VC):主要包含几何结构信息
OC →\rightarrow VC的转换是有损的

主要贡献

1.Extended Cycle Consistent Loss:从VC中去除纹理、颜色和镜面高光。
2.Directional Discriminator:在OC和VC之间创建一个更强的连接,用于去除剩余的纹理和高光。

Extended Cycle Consistent Loss

普通的cycle loss:
在这里插入图片描述
拓展cycle loss:
在这里插入图片描述
xxx是VC图像,yyy是OC图像,GaG_aGa?x→yx \rightarrow yxy的翻译
拓展cycle loss在VC域上比较OC,yyy和重构OC,Ga(Gb(y))G_a(G_b(y))Ga?(Gb?(y))的结构一致性

图示比较:
在这里插入图片描述
在这种情况下,重构OC,Ga(Gb(y))G_a(G_b(y))Ga?(Gb?(y))并没有受到直接的限制。为了让其像一个OC图片,传统上会使用身份损失identity loss来保持其颜色信息。
但我们并不想保留OC的颜色信息,而是考虑从VC的角度保留信息。
Liden(A)=Ey?P(A)∣Ga(y)?y∣\mathcal{L}_{iden}(A) = \mathbb{E}_{y \sim P(A)} | G_a(y) - y| Liden?(A)=Ey?P(A)?Ga?(y)?y
同时会对OC建立传统的GAN Loss。

Directional Discriminator

我们尝试建立一个3player game(2$G111D),其中),其中D$是conditional的,即把G的输入输出都输给它。

在这里插入图片描述
DdirD_{dir}Ddir?任务是区分输入是来自哪个GGG的,即区分输入[y,Gb(y)][y, G_b(y)][y,Gb?(y)][Ga(x),x][G_a(x), x][Ga?(x),x]

当模型收敛时,合成图像需要反映其相应域的真实分布,同时还需要提供DdirD_{dir}Ddir?成对的信息。在这里插入图片描述
完整的目标函数:
在这里插入图片描述
参考超参数α=0.5,λ=10,γ=5\alpha=0.5, \lambda=10, \gamma=5α=0.5,λ=10,γ=5
该文在DDD的每一层应用了spectral normalization