服务器上一个神经网络模型,通过 pycharm 的 ssh remote interpreter 运行和通过命令行直接 Python xxx 运行,结果居然不一样,可能是什么原因呢

2021-10-10 19:21:11 +08:00
 zxCoder

同一个虚拟环境,同一份代码

2044 次点击
所在节点    Python
6 条回复
xd314697475
2021-10-10 19:24:30 +08:00
同一种方法,多次运行的结果一样吗? remote interpreter 会有一个远程的本地的文件,直接查看本地文件和你源文件的区别
iOiOiOiOiO
2021-10-10 19:32:26 +08:00
初始随机变量不同,cpu 和 gpu 结果也不一样
Lirit
2021-10-10 19:48:17 +08:00
模型里 weights,biases 一些参数初始化不一样
black938
2021-10-10 20:03:08 +08:00
1 、神经网络模型需要固定 seed 以保证完全一致的复现,包括但不限于 torch 的 seed 和 numpy 的 seed,可能随机的地方全都需要固定 seed
2 、数据集 load 进来的时候如果 shuffle 了也会导致结果不一样
weah
2021-10-11 11:18:28 +08:00
那每次 ssh 或者 python 的结果都是一样的吗?
zxCoder
2021-10-11 11:20:07 +08:00
@weah 这个是一样的,也就是说直接 ssh,然后命令行跑也能稳定复现,直接从 ide 用远程环境跑也能稳定复现,但两个结果不一样,所以我想应该不是楼上说的问题

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/806877

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX