Python深度学习训练意外终止:退出代码 -1073741571 是什么原因?

python深度学习训练意外终止:退出代码 -1073741571 是什么原因?

python进程意外终止:退出代码-1073741571

问题描述

在使用pycharm和anaconda prompt命令行进行深度学习训练时,训练突然中断,没有任何错误提示,也没有达到预期的迭代次数。事件查看器显示退出代码为 -1073741571 (0xc00000fd)。

原因分析

经过代码排查发现,问题出现在一个训练循环中。源代码将用于收集训练损失的列表loss_list初始化为torch.zeros,但是实际应该初始化为:

loss_list = np.zeros(len(dataloader.dataset))

解决方案

将loss_list初始化为torch.zeros修改为loss_list = np.zeros即可解决问题。

进一步优化

如果收集的损失不需要梯度,还可以进行进一步的优化:

for j in range(batch_size):
  loss_list[index[j]] = loss[j].item()

这样可以避免对每个损失进行backward,提高训练效率。

以上就是Python深度学习训练意外终止:退出代码 -1073741571 是什么原因?的详细内容,更多请关注硕下网其它相关文章!