MLAG 主节点掉电后下行交换机无法正常转发流量

2022-10-13 18:55:08 +08:00
 HawkinsSherpherd
我最近在 GNS3 里做 MLAG 相关的实验,两台 Arista 交换机组 MLAG 集群,下行是一台思科的 Catalyst 交换机,和两台交换机各有一条链路互联,两侧都绑定链路聚合。Arista 上的 MLAG 都配置了双主检测,并有独立的心跳链路。除此之外还配置了 VARP 当网关用。
我测试它的冗余性时发现了问题,我是这样测试的:
禁用主节点上的下行链路,下行交换机的流量能正常转发;
禁用主节点上的上下行链路,下行交换机的流量能正常转发;
禁用心跳链路,两端的 Arista 交换机会有告警信息,但下行交换机的流量仍能正常转发;
再接着,禁用 Peer-Link 链路,主节点已经没有任何联网的地方了,但下行交换机的流量依旧能正常转发。
但当我直接断掉主节点的电来模拟意外掉线的状况时,意外来了。下行交换机没有任何流量转发到 Arista 交换机上,我用 Wireshark 抓包,Arista 方向有 VARP 的免费 ARP 之类的报文过来,而 Catalyst 方向却没有任何业务流量转发到这条链路上。查看两端的链路聚合端口,是处于启用状态的。而生成树也没有问题,处于转发状态。
1169 次点击
所在节点    宽带症候群
4 条回复
HawkinsSherpherd
2022-10-14 08:49:26 +08:00
更新:
我发现下行的 Catalyst 交换机存在一个诡异的 Bug:除非主动禁用到主节点的接口,否则主节点意外掉电后那台 Catalyst 交换机还会把流量往那边发,手动禁用接口后流量能正常转发。
Smallsun1231
2022-10-14 10:11:53 +08:00
Arista 组 MLAG 集群相当于堆叠,逻辑上是一台设备,两块板卡,一台掉电,另外一台正常能用没问题的。
一台思科上联,不应该是分别到两台 Arista 上选一个口组 port-channel 嘛,咋分别到每天都组一个、。
Smallsun1231
2022-10-14 10:12:16 +08:00
每台..
HawkinsSherpherd
2022-10-14 12:07:00 +08:00
@Smallsun1231 对啊,两边的口都组进一个 port-channel ,都是同一个 mlag 组里的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/886718

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX