是什么故障能导致一个光猫下的部分 PPPoE 拨号设备同时失效?

2022-05-04 18:54:57 +08:00
 phpfpm

全流程细节文档详见飞书文档

故障详细经过

概述背景

拓扑:

R483G 4WAN 口路由器的 WAN1 接移动光猫,WAN2 和 WAN3 接电信光猫,WAN4 走 DHCP 接入 K2p 的 LAN1 口

K2P 的 WAN 口接电信光猫,LAN1 接 R483G 的 WAN4 口

实现效果:

在 R483G 的子网内可以直接访问 K2P 子网的机器(反之不行)

故障出现和解决:

K2P 和 R483G 间隔半个小时断网(出现了两三次了,都是 K2P 先断网)

断开 LAN1-WAN4 的网线之后,问题解决

看了两台设备的日志,主要表现都是 PPPoE 无法连接对端服务器。

几个可能性的猜测

电信和移动的光猫都没有问题

  1. 电信的光猫 4 个 LAN 口中还有一个连接一台京东云,该设备这几天一直在线
  2. R483G 连接的两个光猫(移动,电信)都是同时失效和恢复,说明光猫侧没有问题

R483G 大概率也是 OK 的

断开 LAN-WAN 之后,能自行恢复三路 wan 口的拨号

所以,你们猜问题因为啥。。

反正我不管了,打算先把 K2P 换掉,J4125 软路由明天到货,盘一下~

1794 次点击
所在节点    宽带症候群
14 条回复
jousca
2022-05-04 19:33:47 +08:00
你那个 LANA LANB SC 是什么东西? 带光口的 VLAN 交换机?
jousca
2022-05-04 19:37:33 +08:00
另外你是 4 个电信光猫,还是说一个光猫 4 个口你都拿来用?
phpfpm
2022-05-04 19:39:58 +08:00
@jousca
1 一路 sc 光纤带 vlan 隔离的 2 路 lan 口交换机,可以搜下某宝有售
2 一个电信光猫,4 个口分别拨号
jousca
2022-05-04 19:45:09 +08:00
我如果弄这种结构,我内网都不开 DHCP ,其中 483 的 WAN4 改 LAN 口,在 483 上加一条 192.168.0.0/24 静态路由。
在 K2P 上加一条 192.168.10.0/24 静态路由。
phpfpm
2022-05-04 19:49:55 +08:00
@jousca 牛逼 我研究下这个方案

但是 483 应该开 dhcp 吧,不然内网 wifi 设备都用不了?
jousca
2022-05-04 20:09:46 +08:00
@phpfpm 技术上来说,我如果要照顾 wifi 自动获取地址的话,会在 483 ~ AX5400 之间使用管理型交换机,在端口上使用 dhcp snoop ,然后让 AX5400 上开 DHCP ,给你的 192.168.10.X 段的无线设备分配地址。

由于 DHCP SNOOP 的端口限制,AX5400 的 DHCP 广播不会扩散到 483 和你上面的 K2P 网络去。
phpfpm
2022-05-04 20:24:38 +08:00
@jousca 奈斯话是这么说没错诶

但是我现在的方案问题出在哪了呢
lcy630409
2022-05-05 10:24:56 +08:00
大概率是网络风暴了
左上角的电信猫 wan1 2 3 4 他们是一个交换机,剩下的不知道能不能理解
说一个数据流
r483 的 w4 发送了一个数据,数据从 w4 去了 lan-b ,去了 k2p 的 lan1 ,去了 k2p 的 w1 ,w1 又去了电信的 w4 ,又去了电信的 w1 w2 下面的 r483 的 w2 w3 ,,然后又去了 w4 ,一个循环就产生了
lcy630409
2022-05-05 10:35:55 +08:00
看了你的文档
“K2P 是 openwrt ,接口除 LAN/WAN 之外还加了一个 M(anager)AN ,走 dhcp 获取电信光猫的管理 ip(192.168.1.0/24)。当时是为了方便修改配置走的这么一个代理接口。
MAN 接口的设置:防火墙区域:WAN ,协议走 dhcp ,跃点数写的 99 (防止出口流量走这里)
但是后来的问题是,K2P 的 LAN 口设备获取的 ip 紊乱,由 K2P 下发(192.168.0.0/24)和电信光猫下发(192.168.1.0/24)都有

解决方案:关闭光猫的 dhcp ,MAN 口的 IP 走静态指定,下游获取 ip 正常”


这个就是问题所在,关闭了光猫的 dhcp 没有解决实际问题
大概率是 k2p 的网口是共用一个带宽,也是和电信光猫一样 ,几个网口都算做一个交换机了
phpfpm
2022-05-05 12:17:40 +08:00
@lcy630409 感谢回复这么多。

我理一下电信的各个网口的情况:

电信光猫确实是 WAN1~WAN4 是共享一个子网的,但是这是以太网的包( MTU=1500),K2P 的 W1 到电信的 W4 的包走的是 PPPoE 协议( MTU=1492 ),这部分包是不会被电信的 W1~W3 侦听到的(我。。觉得。。)

所以结合你下一个帖子,我替换一下 K2P 看看还会不会出现这样的情况。


昨天我做的一个解决方案是,把 K2PLAN1 到 483 的 WAN4 的网线换了一根,不知道是不是网线的故障,再等等情况复现(一般需要两三天出现一次)
lcy630409
2022-05-05 14:40:37 +08:00
@phpfpm
测试有没有好的方法很简答,在 k2p 的 lan 口(或者 k2p 的替代者)下,能否获取的到电信猫的 dhcp ,如果还能获取到 说明链路还是通的。

pppoe 是建立在以太网上的,除了 pppoe 在用 其他协议也能走的,特别是广播
lcy630409
2022-05-05 14:52:10 +08:00
不排除你用的那个光口的 VLAN 交换机导致了环路
其实感觉这个问题 概率应该大一些
phpfpm
2022-05-05 17:40:40 +08:00
@lcy630409 这个我测过,是可以的

所以出现这个问题是 k2p 的 openwrt 的配置不对?

后者 vlan 交换机出现环路。。我也高度怀疑

但是很奇怪的是,拔一下线就能解决了。。。。
lcy630409
2022-05-05 21:47:48 +08:00
@phpfpm 拔线 环路就断开了,
一个个的查吧,环路好查点

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/850801

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX