开启 IPv6 后网速变得很慢?可能是 PMTU 黑洞的问题

2021-09-05 22:23:38 +08:00
 raysonx

发现最近经常有人提到开启 IPv6 连接速度慢的问题。目前国内确实存在支持 IPv6 的服务器、CDN 节点不够多,IPv6 国际带宽比 IPv4 带宽小的问题,但也不至于会打开国内网站都卡。通常情况下遇到这个问题说明你到目标服务器的链路上存在 PMTU 黑洞。

关于 PMTU 黑洞

MTU (Maximum transmission unit) 是一条链路上可以通过的三层数据包的最大尺寸(包含 IP 包头)。以太网上默认的 MTU 是 1500 字节,但是你和目标服务器之间的路径上可能存在小于 MTU 1500 的链路。这条路径上最小的 MTU 值就是整条路径的 PMTU 值。路由器在转发包时,超过 MTU 大小的包会被分片( Fragmentation ),也就是一个大包会被分切为多个不超过 MTU 的小包进行传输,传输效率会下降。

终端设备在发包时,也可以设置 DF ( Don't Fragment )标记来告诉路由器不要分片。这时中间路由器会丢掉超过 MTU 的包,回复一条 ICMP Fragmentation Needed 消息。发送者收到这个包后,下次就会发小一点的包,这个过程叫做 PMTU Discovery 。现实中可以看到 HTTPS ( TLS )的流量大都是带 DF 标记的。

然而,互联网上有大量的中间设备为了所谓的“安全”或者没有正确配置,不回应 ICMP Fragmentation Needed 包,这使得访问某些网站时如果某个包的大小超过了 PMTU,会被无声地丢弃,直到 TCP 协议发现超时丢包进行重传,这非常缓慢。遇到这种情况,我们可以说你和目标服务器的路径上存在 PMTU 黑洞。

此外,IPv6 不支持分片,换句话说可以理解为 IPv6 下所有的包都是带 DF 标记的。中间路由器在遇到包尺寸大于 MTU 的情况时,应该回应 ICMPv6 Packet Too Big 消息。同样的,由于种种原因,某些中间设备可能会直接丢包而不回应 ICMPv6 Packet Too Big 消息,直到 TCP 协议发现超时丢包进行重传。。。

为什么 IPv4 没有这个问题

其实 IPv4 也有这个问题,我不只一次见网友说自己搭的软路由访问某些网站非常慢,而换回硬路由就正常。这是因为多数家用路由器默认对 IPv4 下的 TCP 开启了 MSS (maximum segment size) Clamping (使用 OpenWRT 软路由的朋友们可以在防火墙设置中找到 MSS Clamping 开关)。MSS Clamping 是针对 PMTU 黑洞的 Workaround,简单来说就是 TCP 握手时有个 MSS 字段决定单个 TCP 包的最大尺寸。路由器可以通过嗅探 TCP 握手包,把 MSS 值改小,使最终的三层 IP 包的尺寸( MSS+TCP 头大小+IP 头大小)不超过某个特定的值。

总结

现在国内 ISP 一般都是通过 PPPoE 虚拟拨号建立 WAN 口连接的。Ethernet 的默认 MTU 是 1500,但是 PPPoE 隧道有 8 个 bytes 的开销,所以 PPPoE 虚连接的 MTU 就是 1500-8=1492,减掉 IPv4 包头( 20 字节)和 TCP 包头( 20 字节),可以得知 IPv4 下需要把 MSS 设为 1452 以下。

IPv6 的包头是 40 字节,所以 IPv6 下需要把 MSS 设为 1432 以下。

这时问题来了,目前很多光猫、家用路由器对 IPv6 的优化很差,不支持对 IPv6 下的 TCP 包进行 MSS Clamping,这就导致访问 IPv6 网站时,若路径中存在 PMTU 黑洞,则打开很慢。

我前段时间帮朋友配置 IPv6 时发现了很多光猫、家用路由器的固件问题,使得国内使用 IPv6 的体验不太理想。我打算抽空专门开一个帖子去讨论这些问题,声讨那些垃圾厂家。目前来看,要想在国内比较理想地体验 IPv6,你需要把光猫改为桥接模式,并使用 OpenWRT 或者 VyOS 这类对 IPv6 支持较好的软路由。

33093 次点击
所在节点    宽带症候群
65 条回复
goodokgood1
2023-04-28 11:25:11 +08:00
华硕路由器刷了梅林固件,也可以这样改吗?
fox233
2023-04-28 14:01:31 +08:00
只要是在 1452 以下就可以是吧 1360 可以吗
raysonx
2023-04-28 15:02:52 +08:00
@fox233 1452 是 ipv4 的,ipv6 不能超过 1432 。MTU 更小一些也可以,不过理论上因为传输效率低了网速要慢一点点。

@goodokgood1 不清楚梅林,但只要固件提供这个功能都可以试试。
fox233
2023-04-28 17:20:12 +08:00
@raysonx 能慢多少
letmefly
2023-05-03 19:21:58 +08:00
今天发现 https://zhuanlan.zhihu.com/p/435392896 有个更简单的方法。
letmefly
2023-05-03 19:42:55 +08:00
经过实践,还是这样设置快
RouterOS 里设置 MSS 的命令。其中 pppoe-out1 是 wan 口,1420 是要 MSS 值,请根据需要修改。

/ipv6 firewall mangle add chain=forward out-interface=pppoe-out1 protocol=tcp tcp-flags=syn action=change-mss new-mss=1420
zent00
2023-05-10 09:03:46 +08:00
最近在折腾 VyOS 1.4 ,发现和 1.3 设置 MSS 有点不一样,在这里把两个版本的配置方法都贴一下:

VyOS v1.3
set firewall options interface pppoe0 adjust-mss6 1432

VyOS v1.4
set interfaces pppoe pppoe0 ipv6 adjust-mss 1432
JimmyChan1506
2023-07-07 16:10:59 +08:00
最近 ipv4 公网被取消了,只能用 ipv6 的公网 ip, 用的就是 openwrt 拨号的方案,但不是很确定里面的设置有没有问题,只能是能用,但感觉网速下了一个台阶,楼主有没有兴趣搞一个完整点的 openwrt 下拨号 ipv6 的教程?网上找的感觉都是片面的…
raysonx
2023-07-08 11:52:37 +08:00
@JimmyChan1506 我本来打算几篇文章系统讲一下配置家庭 IPv6 网络的最佳实践的,可惜这一拖就是两年。我下午写点简单的东西吧。
JimmyChan1506
2023-07-09 20:50:18 +08:00
@raysonx 感恩, 期待
letmefly
2023-07-10 18:20:50 +08:00
@JimmyChan1506 最近 ipv4 公网被取消了,只能用 ipv6 的公网 ip, 用的就是 openwrt 拨号的方案,但不是很确定里面的设置有没有问题,只能是能用,但感觉网速下了一个台阶,楼主有没有兴趣搞一个完整点的 openwrt 下拨号 ipv6 的教程?网上找的感觉都是片面的…

昨天在 er-x 路由器上又又又刷了 openwrt 22.03.5 固件,就是为了用 ipv6 。之前来回在原厂固件和 openwrt 之间反复,但是原厂固件不论我怎么样设置都会生成很多临时地址,openwrt 就不会。原版的 openwrt 对 ipv6 的支持是很好的,只需要简单的配置成 pppoe 协议,填上正确的用户和密码就能获得 ipv6 地址了。但是因为我会用 zerotier ,所以当我配置 zerotier 重启后,就会发现按照默认配置的 ipv6 不能用了,具体表现就是 win10 的电脑 ping ipv6 的地址没反应,ipv6 测试也没 v6 地址。昨天我先是在接口-->wan--> 高级设置--> 获取 IPv6 地址--> 已禁用;然后在接口把系统创建的 wan6 接口删除了,然后再重建了一个接口,还是叫 WAN6 ,协议先 DHCPv6 客户端,设置就选择"@wan" ,然后用了一天了,我的 win10 电脑还是只有一个临时地址,跑 ipv6 网页测试也是非常畅通的。
raysonx
2023-07-10 22:20:44 +08:00
@letmefly 关于很多临时地址的问题,操作系统只会为同一个前缀生成一个临时地址,所以出现这种情况时是不是被分配了多个前缀呢?可能是重新拨号后前缀变化导致旧的前缀没有移除。请看我的这篇文章 https://v2ex.com/t/955636#reply0

此外我曾经用过一段时间 EdgeOS ,它的固件不能正确的移除失效的旧前缀,你可以关闭 DHCPv6 并参考 https://community.ui.com/questions/Feature-request-correct-handling-of-IPv6-router-advertisements-for-dial-up-connections/1a2b7d1d-90f4-4273-8c8e-8021384d6959 修改原厂固件的部分代码来解决。

关于速度问题,请先检查 MTU 。关于完整点的 openwrt 的教程,已经在计划中。关于 Zerotier 的问题,这不是几句话就能调试清楚的,建议你开个新帖询问。
zbowen66
2023-07-11 08:51:26 +08:00
@icegaze #4 感谢楼主,感谢层主,真的有用!
sdc6882278
2023-09-01 16:01:38 +08:00
关于 IPv6 的分片问题这里可能有所误区,IPv6 是支持分片的,不支持的是中间设备分片而是支持发起以及接受者分片,否则对于一个小于 1280 的隧道,就不能传输 IPv6 了?显然是不可能的,所以请作者勘误一下。
Dk2014
2024-07-14 16:09:06 +08:00
openwrt 省流:
网络-防火墙-区域-wan-编辑-MSS 钳制 打开
新的固件一般都默认打开的,所以说什么都不用管😅
我还瞎折腾半天内网的 mtu 设置,一点用没有
mxT52CRuqR6o5
2024-07-15 11:46:07 +08:00
不桥接到软路由是不是就无解了?
james19820515
2024-07-19 10:26:11 +08:00
拜读了。
fugu37
2024-08-06 02:48:53 +08:00
通过 IPv6 下访问 https://www.baidu.com ,TLS 握手时收不到 Server Hello 信息,导致连接失败,与 https://www.v2ex.com/t/824831 的现象一致。

问题是我的光猫防火墙上已经配置好 --clamp-mss-to-pmtu 了,将 pppoe 接口上的 mtu 从 1492 减到 1450 ,问题才消失。
fugu37
2024-08-07 00:19:34 +08:00
@fugu37 #58

经过排查是 lan 侧接口 IPv6 mtu (/proc/sys/net/ipv6/conf/br0/mtu )因为误操作被改成 1450 了,但是流量经过这个接口时光猫不会返回 packet too big 消息,原因不明。

将 mtu 恢复到 1500 也能解决问题。
ravenkong
2024-08-10 14:34:17 +08:00
@ppbaozi 感谢!刚测试了下好像是的,ND 里设置 MTU 就行了,不需要动 ipv6 的防火墙规则

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/800024

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX