V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lxdlam
V2EX  ›  Amazon Web Services

AWS 复盘报告出来了

  •  
  •   lxdlam ·
    lxdlam · 15 小时 54 分钟前 · 2083 次点击
    https://aws.amazon.com/cn/message/101925/

    省流:
    DynamoDB 的 DNS 子系统出现了 Race Condition 导致可用端点被清空,依赖的服务连接失败
    -> 在此期间 EC2 的核心管理器被大量旧 event 冲击过载,导致资源池空间上报不准确和网络状态在 VPC 内扩散出现延迟
    -> NLB 在接受这些积压消息的时候来回切换检测结果( healthy 和 unavailable 之间跳变),下游服务连接受到影响
    4 条回复    2025-10-23 16:37:26 +08:00
    Ketteiron
        1
    Ketteiron  
       15 小时 27 分钟前
    一句话总结:DynamoDB 自动化系统因潜在竞态条件导致删除了自己的 DNS 记录。
    感觉各种重大事故都是因为自我删除或者自我重启失败。
    mytsing520
        2
    mytsing520  
    PRO
       15 小时 20 分钟前
    越是底层的故障,影响越大;越是影响大的故障,往往故障原因越简单
    kevan
        3
    kevan  
       15 小时 17 分钟前
    所以还是互不干涉吧
    ypcs03
        4
    ypcs03  
       12 小时 40 分钟前 via iPhone
    还好没有互相依赖,要是 DDB 的恢复依赖 EC2 的 instance launch 就搞笑了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   903 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 21:18 · PVG 05:18 · LAX 14:18 · JFK 17:18
    ♥ Do have faith in what you're doing.