lx01xsz
V2EX  ›  问与答

Intel E1000E 网卡高负载断流

  •  
  •   lx01xsz · Jan 27, 2025 · 2448 views
    This topic created in 471 days ago, the information mentioned may be changed or developed.

    设备是 NUC8beki5 ,装了 PVE 。网卡在网络 IO 高负载时会发生问题,syslog 如下。

    现象 1: NUC 网络连接中断,等待几十秒-几分钟后恢复

    现象 2: 协商速率由 1000MB/s 变为 100MB/s ,手动设置为 1000MB/s 后恢复 (网卡和路由器都支持千兆)

    Jan 27 23:35:35 pve kernel: e1000e 0000:00:1f.6 eno1: NIC Link is Down
    Jan 27 23:35:35 pve kernel: vmbr0: port 1(eno1) entered disabled state
    Jan 27 23:35:42 pve kernel:  connection1:0: ping timeout of 5 secs expired, recv timeout 5, last rx 10254116869, last ping 10254121984, now 10254127104
    Jan 27 23:35:42 pve kernel:  connection1:0: detected conn error (1022)
    Jan 27 23:35:48 pve pvestatd[1233]: status update time (19.582 seconds)
    Jan 27 23:36:12 pve kernel: e1000e 0000:00:1f.6 eno1: NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx
    Jan 27 23:36:12 pve kernel: vmbr0: port 1(eno1) entered blocking state
    Jan 27 23:36:12 pve kernel: vmbr0: port 1(eno1) entered forwarding state
    Jan 27 23:36:14 pve iscsid[3627392]: connection1:0 is operational after recovery (3 attempts)
    Jan 27 23:36:37 pve pvestatd[1233]: status update time (19.299 seconds)
    Jan 27 23:36:38 pve kernel: sd 4:0:0:0: Power-on or device reset occurred
    

    驱动版本信息:

    root@pve:~# ethtool -i eno1 
    driver: e1000e
    version: 6.8.12-4-pve
    firmware-version: 0.4-4
    expansion-rom-version: 
    bus-info: 0000:00:1f.6
    supports-statistics: yes
    supports-test: yes
    supports-eeprom-access: yes
    supports-register-dump: yes
    supports-priv-flags: yes
    

    已经尝试更换网线并按照下面两个帖子的建议关闭了 tso

    https://forum.proxmox.com/threads/e1000e-network-issue-on-proxmox.139141/

    https://forum.proxmox.com/threads/e1000-driver-hang.58284/page-8#post-390709

    但在持续高负载时还会出现上述问题,这个问题是在用 Rsync 恢复备份的时候发现的,尝试用 --bwlimit 限制 Rsync 到 50M, 40M, 30M 。

    但均无法解决问题,难道只有硬改网卡了吗?

    8 replies    2026-02-07 04:39:51 +08:00
    Kinnice
        1
    Kinnice  
       Jan 27, 2025 via Android
    换个驱动
    mengyx
        2
    mengyx  
       Jan 27, 2025
    没有特殊情况的话,用 VirtIO 性能最好
    LaoLeyuan
        3
    LaoLeyuan  
       Jan 27, 2025
    @mengyx 楼主说的是硬件的问题吧,不是虚拟机上的。
    lx01xsz
        4
    lx01xsz  
    OP
       Jan 27, 2025
    @mengyx
    @LaoLeyuan
    是的,是宿主机上的,虚拟机用的都是 VirtIO
    lx01xsz
        5
    lx01xsz  
    OP
       Jan 27, 2025
    @Kinnice 现在的驱动是和 PVE 内核绑定的,手动编译 Intel 官方驱动的话,和 PVE 的兼容会不会有问题?
    Kinnice
        6
    Kinnice  
       Jan 27, 2025 via Android
    @lx01xsz pve 是基于 debian 的,兼容性很好的
    ysc3839
        7
    ysc3839  
       Jan 28, 2025 via Android
    千兆掉到百兆可能是信号完整性问题,建议换根网线试试。
    不然也有可能是网卡过热,但印象中 Intel 网卡过热不会调速,可以用排除法试试。
    investor
        8
    investor  
       Feb 7 via iPhone
    e1000e 网卡,某些环境会出现 TX hang ,英特尔官方没有报告缺陷,但在社区广泛讨论,引用一个兄弟的说法,这个讨论从 2013 年讨论到了 2026 年,讨论了 13 年了。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   918 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 40ms · UTC 20:30 · PVG 04:30 · LAX 13:30 · JFK 16:30
    ♥ Do have faith in what you're doing.