[CVPR2020] Augmenting Colonoscopy using Extended and Directional CycleGAN for Lossy Image Translation
-
-
- 背景
- 主要贡献
- Extended Cycle Consistent Loss
- Directional Discriminator
-
背景
本文提出Extended and Directional CycleGAN (XDCycleGAN),用于在OC和VC之间进行有损不成对图像翻译
光学结肠镜检查(OC):主要包含几何结构+颜色+纹理+镜面高光信息
虚拟结肠镜检查(VC):主要包含几何结构信息
OC →\rightarrow→ VC的转换是有损的
主要贡献
1.Extended Cycle Consistent Loss:从VC中去除纹理、颜色和镜面高光。
2.Directional Discriminator:在OC和VC之间创建一个更强的连接,用于去除剩余的纹理和高光。
Extended Cycle Consistent Loss
普通的cycle loss:
拓展cycle loss:
xxx是VC图像,yyy是OC图像,GaG_aGa?是x→yx \rightarrow yx→y的翻译
拓展cycle loss在VC域上比较OC,yyy和重构OC,Ga(Gb(y))G_a(G_b(y))Ga?(Gb?(y))的结构一致性
图示比较:
在这种情况下,重构OC,Ga(Gb(y))G_a(G_b(y))Ga?(Gb?(y))并没有受到直接的限制。为了让其像一个OC图片,传统上会使用身份损失identity loss来保持其颜色信息。
但我们并不想保留OC的颜色信息,而是考虑从VC的角度保留信息。
Liden(A)=Ey?P(A)∣Ga(y)?y∣\mathcal{L}_{iden}(A) = \mathbb{E}_{y \sim P(A)} | G_a(y) - y| Liden?(A)=Ey?P(A)?∣Ga?(y)?y∣
同时会对OC建立传统的GAN Loss。
Directional Discriminator
我们尝试建立一个3player game(2$G111D),其中),其中),其中D$是conditional的,即把G的输入输出都输给它。
DdirD_{dir}Ddir?任务是区分输入是来自哪个GGG的,即区分输入[y,Gb(y)][y, G_b(y)][y,Gb?(y)]和[Ga(x),x][G_a(x), x][Ga?(x),x]。
当模型收敛时,合成图像需要反映其相应域的真实分布,同时还需要提供DdirD_{dir}Ddir?成对的信息。
完整的目标函数:
参考超参数α=0.5,λ=10,γ=5\alpha=0.5, \lambda=10, \gamma=5α=0.5,λ=10,γ=5。
该文在DDD的每一层应用了spectral normalization