Python深度学习训练意外终止:退出代码 -1073741571 是什么原因?
python进程意外终止:退出代码-1073741571
问题描述
在使用pycharm和anaconda prompt命令行进行深度学习训练时,训练突然中断,没有任何错误提示,也没有达到预期的迭代次数。事件查看器显示退出代码为 -1073741571 (0xc00000fd)。
原因分析
经过代码排查发现,问题出现在一个训练循环中。源代码将用于收集训练损失的列表loss_list初始化为torch.zeros,但是实际应该初始化为:
loss_list = np.zeros(len(dataloader.dataset))
解决方案
将loss_list初始化为torch.zeros修改为loss_list = np.zeros即可解决问题。
进一步优化
如果收集的损失不需要梯度,还可以进行进一步的优化:
for j in range(batch_size): loss_list[index[j]] = loss[j].item()
这样可以避免对每个损失进行backward,提高训练效率。
以上就是Python深度学习训练意外终止:退出代码 -1073741571 是什么原因?的详细内容,更多请关注硕下网其它相关文章!