当前位置: 代码迷 >> 综合 >> pytorch之cudnn.benchmark和cudnn.deterministic
  详细解决方案

pytorch之cudnn.benchmark和cudnn.deterministic

热度:72   发布时间:2023-09-22 14:29:08.0

问题

在很多情况下我们都能看到代码里有这样一行:

torch.backends.cudnn.benchmark = true

而且大家都说这样可以增加程序的运行效率。那到底有没有这样的效果,或者什么情况下应该这样做呢?

解决办法

总的来说,大部分情况下,设置这个 flag 可以让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法,来达到优化运行效率的问题。

一般来讲,应该遵循以下准则:

  1. 如果网络的输入数据维度或类型上变化不大,设置 torch.backends.cudnn.benchmark = true 可以增加运行效率;
  2. 如果网络的输入数据在每次 iteration 都变化的话,会导致 cnDNN 每次都会去寻找一遍最优配置,这样反而会降低运行效率。

这下就清晰明了很多了。

benchmark模式会提升计算速度,但由于计算中有随机性,每次网络前馈结果略有差异

torch.backends.cudnn.benchmark = true

如果想要这种波动,设置

torch.backends.cudnn.deterministic = true
  相关解决方案