[求助]Mellanox ConnectX-3 网卡频繁重启无法连接网络(偶现)

74 天前
 AkariChan

这几天有线网络突然断了, 由于个人能力原因无法定位分析问题, 想请教下万能的 v 友看看可能是什么情况导致的以及后续如何避免出现这种问题.

问题表现:

睡眠唤醒的情况或者开机的情况下有可能出现该问题, 具体表现是 在网络适配器面板中持续事件到达 3~4s 后清零(重启了), 一直反复, 禁用设备/拔网线/换网口/重装驱动 等均无法解决此问题, 重启有一定概率能恢复正常.

在事件管理器中查看可以看到每次重启都会报以下错误(网络上没有找到 0x40000 的代码):

Restart Mellanox ConnectX-3 Pro Ethernet Adapter #2 as a result of error that was reported by sensors 0x40000
 Self healing state:
 	Restarts count: 3

PS: 值得一提的是, 本台物理机还有安装有 Ubuntu22.04, 虽然使用频率较低, 但是在该系统下有线连接都是正常的, 感觉不是硬件问题.

相关配置:

连接方式是两张 cx314a 通过光纤直连, 另一块网卡在装有 truenas 系统的的电脑上, nas 通过建立网桥使主机连接到路由器(DHCP)上, 路由器通过 mac 地址分配固定 ip.

757 次点击
所在节点    硬件
2 条回复
billccn
73 天前
卡拔下来重插一下看有没有改善?有的时候和主板接触因为外力碰撞会不良。

还有这种服务器用的卡在普通机箱用的话一定要加强制散热,芯片过热的话会出现各种不稳定。
AkariChan
73 天前
@billccn 散热这个确实没注意到, 网卡上没有额外加装风扇. 不过我感觉不是硬件问题, 拔卡重插也试过了, 主要是这台电脑在用 ubuntu 时没有出现过网络问题.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1018205

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX