遇到一个奇怪的坑:阿里云域名解析部分地区不生效

2018-11-12 17:29:16 +08:00
 ccc008
事情得从上周说起。

11 月 7 日,公司有台服务器需要升级,我就把服务器上的程序迁移到新服务器,然后通知同事把 aa.xxxx.com 指向了新服务器。08:52 分把解析修改好。我测试了一下没问题。就忙别的事情去了。很平常的一次迁移,也没当一回事。

到 10 点多,有用户投诉,aa.xxxx.com 访问不了。我想着可能是个别解析没生效。告诉他让他等一下。等到下午,这个用户还是访问不到。陆续有其他用户也投诉,他们相同的特点就是都是江苏的用户。远程到用户电脑,测试发现解析确实没生效,还是指向的老服务器。这下有点悲剧了,抓紧把老服务器环境恢复过来,临时做上双向同步,折腾到晚上。因为是个简单的单点应用,以前也没考虑到多服务器的场景,虽然临时做上双向同步,但是文件、图片同步还是会有个时间差。没办法先将就着吧。我想着 24 小时后,解析应该都要生效了吧,到明天解析生效也就好了。
11 月 8 日 上班了。第一时间用 ping.chinaz.com 检查解析情况。我去,江苏地区还是部分没生效。坐不住了,抓紧联系阿里云客服,客服回复“我这里测试正常,可能是用户本地网络问题”。废话嘛,我这测试也正常呢。然后让耐心等待,最长 72 小时生效。
11 月 9 日 未恢复(已到 72 小时)
11 月 10 日 未恢复
11 月 11 日 未恢复
11 月 12 日 还是未恢复,提工单。客服回复“您好,这个可能是江苏部分地区的 local dns 有问题。我们测试看是正常的。” local dns 是出差了吗 快一周还不归位。这时候我猜想阿里云解析存在问题的可能性比较大。导出解析记录。导入到 dnspod,修改 DNS 服务器到 dnspod。联系江苏用户测试,解析正常了!!!花了 5 分钟不到切换到 dnspod,问题解决了。

归纳起来,一开始太相信阿里云解析了。想着用户本地 dns 出问题的概率,大于阿里云出问题的概率。不知道如果我不切换解析服务。一直等着,阿里云解析多久能恢复正常呢?
4563 次点击
所在节点    全球工单系统
4 条回复
kimi815
2018-11-12 17:55:52 +08:00
之前域名从亚马逊迁移到阿里云解析,修改 IP 地址后 4 天都没生效。后来查了一下,原来是湖北电信的 dns 还缓存着我域名之前在亚马逊的 dns 服务器一直不更新,然后直接在亚马逊上把 IP 地址改一下就生效了,运营商 dns 的缓存劫持太坑了。
zanzhz1101
2018-11-12 17:56:38 +08:00
dnspod 确实快
uqf0663
2018-11-12 18:16:54 +08:00
dnspod 也一样,我昨天修改了一个 IP,到现在还有某些省份没生效,也包括江苏,这是运营商 DNS 的锅。
lhx2008
2018-11-12 18:33:52 +08:00
TTL 很多运营商不遵守,没办法,我觉得不是阿里云的锅

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/507097

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX