Dilated Convolutions——扩张卷积_综合

文章作者：Tyan
博客：noahsnail.com | CSDN | 简书、

1. 扩张卷积

Dilated Convolutions，翻译为扩张卷积或空洞卷积。扩张卷积与普通的卷积相比，除了卷积核的大小以外，还有一个扩张率(dilation rate)参数，主要用来表示扩张的大小。扩张卷积与普通卷积的相同点在于，卷积核的大小是一样的，在神经网络中即参数数量不变，区别在于扩张卷积具有更大的感受野。感受野是卷积核在图像上看到的大小，例如 $\times 3$ 卷积核的感受野大小为9。

2. 示意图

下图是扩张卷积的示意图。

Dilated Convolution

(a) 普通卷积，1-dilated convolution，卷积核的感受野为 $\times 3 = 9$ 。
(b) 扩张卷积，2-dilated convolution，卷积核的感受野为 $\times 7 = 49$ 。
? 扩张卷积，4-dilated convolution，卷积核的感受野为 $15 \times 15 = 225$ 。

从上图中可以看出，卷积核的参数个数保持不变，感受野的大小随着“dilation rate”参数的增加呈指数增长。

3. 优点

扩展卷积在保持参数个数不变的情况下增大了卷积核的感受野，同时它可以保证输出的特征映射（feature map）的大小保持不变。一个扩张率为2的3×3卷积核，感受野与5×5的卷积核相同，但参数数量仅为9个，是5×5卷积参数数量的 $36\%$ 。

4. 应用

扩张卷积在图像分割、语音合成、机器翻译、目标检测中都有应用。

5. 参考资料

Multi-Scale Context Aggregation by Dilated Convolutions