今天在用 GPU 跑模型时,报了如下错误,绝望,简直是绝望。。。
错误定位到了计算 loss 的位置,通过打日志,记录传入loss的label和预测值,发现出错时,预测值里有 nan。
检查代码,发现了除 0 运算,改之即可。
查阅资料发现,该错误还有可能由以下原因引起:
- 预测值和标签长度不一致
- 预测值或标签值不在 [0, 1] 范围内
今天在用 GPU 跑模型时,报了如下错误,绝望,简直是绝望。。。
错误定位到了计算 loss 的位置,通过打日志,记录传入loss的label和预测值,发现出错时,预测值里有 nan。
检查代码,发现了除 0 运算,改之即可。
查阅资料发现,该错误还有可能由以下原因引起: