pytorch之cudnn.benchmark和cudnn.deterministic_综合

问题

在很多情况下我们都能看到代码里有这样一行：

torch.backends.cudnn.benchmark = true

而且大家都说这样可以增加程序的运行效率。那到底有没有这样的效果，或者什么情况下应该这样做呢？

总的来说，大部分情况下，设置这个 flag 可以让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法，来达到优化运行效率的问题。

一般来讲，应该遵循以下准则：

这下就清晰明了很多了。

benchmark模式会提升计算速度，但由于计算中有随机性，每次网络前馈结果略有差异

torch.backends.cudnn.benchmark = true

如果想要这种波动，设置

torch.backends.cudnn.deterministic = true