V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
工单节点使用指南
• 请用平和的语言准确描述你所遇到的问题
• 厂商的技术支持和你一样也是有喜怒哀乐的普通人类,尊重是相互的
• 如果是关于 V2EX 本身的问题反馈,请使用 反馈 节点
Aliencn
V2EX  ›  全球工单系统

阿里云炸了

  •  
  •   Aliencn · 2018-06-27 16:28:20 +08:00 · 28119 次点击
    这是一个创建于 2101 天前的主题,其中的信息可能已经有所发展或是发生改变。

    控制台连不上

    API 各种报错

    一些阿里产品的官方群的用户已经各种抱怨了

    第 1 条附言  ·  2018-06-27 17:06:48 +08:00
    https://help.aliyun.com/noticelist/articleid/24179443.html?spm=a2c4g.789004748.n2.6.NO57eQ


    [阿里云] [网络] [异常通告]
    异常时间:北京时间 2018 年 6 月 27 日 16:21 左右。
    异常概述:于北京时间 2018 年 6 月 27 日 16:21 左右开始,阿里云部分产品及账号登陆出现访问异常,阿里云工程师正在紧急处理中,请您稍后重试。
    有任何问题,可随时通过服务电话 95187 联系反馈。

    [异常更新]
    北京时间 2018 年 6 月 27 日 16:50
    目前受影响的业务正在逐步恢复中,若遇到异常,请您稍等后重试。
    第 2 条附言  ·  2018-06-27 17:44:56 +08:00
    [异常更新]
    北京时间 2018 年 6 月 27 日 17:30
    目前受影响的业务大部分已经恢复正常,请您确认。若还有异常,请您跟我们反馈,谢谢。


    目前阿里公告说已经恢复了。大家可以看一下自己的业务有没有问题。
    第 3 条附言  ·  2018-06-27 18:14:05 +08:00
    坐等阿里云官方公开故障原因,以及赔偿方案。
    173 条回复    2018-06-28 13:15:11 +08:00
    1  2  
    Mitt
        101
    Mitt  
       2018-06-27 17:28:33 +08:00
    @jayin 明显就是背锅的, 哪家实习生能有那么大权限碰业务的, 拿脚想都不可能让一个啥都不懂的碰这么重要的东西的
    zsdroid
        102
    zsdroid  
       2018-06-27 17:31:59 +08:00
    @jayin #97 所以这是实习生的锅还是测试的锅?
    tiancaiyong
        103
    tiancaiyong  
       2018-06-27 17:32:55 +08:00
    上午当着 CTO 面提出想要把自建的 MQ 切到阿里云,然后阿里云下午就搞事情,我还能咋说
    xiaoyang7545
        104
    xiaoyang7545  
       2018-06-27 17:34:02 +08:00
    @jayin 感觉不能吧。关键服务直接给实习生做了还敢上线,不 review code 的?
    PureWhite
        105
    PureWhite  
       2018-06-27 17:35:04 +08:00
    看来阿里云花大钱在世界杯打的广告打水漂了
    gccplus
        106
    gccplus  
       2018-06-27 17:35:12 +08:00   ❤️ 1
    实习生,临时工,黑客攻击,反正不敢甩锅给运营商的
    ooTwToo
        107
    ooTwToo  
       2018-06-27 17:37:05 +08:00
    Failed to collect dependencies at com.qiniu:qiniu-java-sdk:jar:[7.2.0,7.2.99]: No versions available for com.qiniu:qiniu-java-sdk:jar:[7.2.0,7.2.99] within specified range -> [Help 1]
    mageemeng
        108
    mageemeng  
       2018-06-27 17:37:18 +08:00
    炸了炸了
    majunbo
        109
    majunbo  
       2018-06-27 17:37:37 +08:00
    @tiancaiyong 来吧,买华为我可以支持你。:)
    torment5524
        110
    torment5524  
       2018-06-27 17:38:18 +08:00
    oss 还没好。。。数据库和服务器还算是正常。。。
    lamCJ
        111
    lamCJ  
       2018-06-27 17:43:39 +08:00
    实习生:随便你们吧 什么都是劳资背锅 现在又是当运维删服务
    tingyunsay
        112
    tingyunsay  
       2018-06-27 17:45:36 +08:00
    域名代金券怎么不能使用了啊.....马上到期了都,麻烦问下 @Aliencn
    Aliencn
        113
    Aliencn  
    OP
       2018-06-27 17:47:20 +08:00   ❤️ 1
    @tingyunsay 我不是阿里的人,建议你开工单问一下吧
    Dwwwwww
        114
    Dwwwwww  
       2018-06-27 17:51:27 +08:00
    阿里云会不会补偿啊(我猜不会
    Aliencn
        115
    Aliencn  
    OP
       2018-06-27 17:54:53 +08:00
    @Dwwwwww 我之前都找阿里赔偿过很多次了,但是我希望这次阿里能主动赔偿
    tingyunsay
        116
    tingyunsay  
       2018-06-27 17:57:20 +08:00
    @Aliencn 好的,不好意思问错了哈....(lll ¬ω¬)
    1yndonn3u
        117
    1yndonn3u  
       2018-06-27 18:02:08 +08:00


    哪个同学知道原因
    1yndonn3u
        118
    1yndonn3u  
       2018-06-27 18:02:48 +08:00
    @tingyunsay #95 这个是怎么回事啊,是什么服务 404 了好几天啊?好想了解下。
    loserwn
        119
    loserwn  
       2018-06-27 18:03:14 +08:00   ❤️ 1
    1024MB
        120
    1024MB  
       2018-06-27 18:07:35 +08:00 via Android
    so 不出来解释一下?这都多长时间了
    wingspread
        121
    wingspread  
       2018-06-27 18:09:53 +08:00
    正发布程序呢,阿里云挂了。:(
    luxin88
        122
    luxin88  
       2018-06-27 18:12:42 +08:00
    阿里云刚给我打完骚扰电话,然后就挂了
    1yndonn3u
        123
    1yndonn3u  
       2018-06-27 18:13:41 +08:00


    这么多人都遇到了,只能说明现在阿里云的确做大了,太多人在使用阿里云了。
    orzcc
        124
    orzcc  
       2018-06-27 18:19:29 +08:00
    @1yndonn3u 市场占有率肯定的啊,国内遥遥领先第一,明摆着。这次问题也算是特大级故障了。
    fhefh
        125
    fhefh  
       2018-06-27 18:25:28 +08:00
    收到客户经理发的消息了~~~ 我上去瞄了下 还好没业务 嘿嘿~
    galvinwang007
        126
    galvinwang007  
       2018-06-27 18:29:18 +08:00
    实习生能有这么大权限????
    jiangnanyanyu
        127
    jiangnanyanyu  
       2018-06-27 18:32:27 +08:00 via Android
    腾讯云或成为最大赢家
    anotherlf
        128
    anotherlf  
       2018-06-27 18:34:15 +08:00 via Android
    上午阿里云还给我打电话说有促销活动。这下午就挂了啊
    jizhu
        129
    jizhu  
       2018-06-27 18:35:58 +08:00
    总结:阿里云炸了,要赔偿,过程不重要
    pepesii
        130
    pepesii  
       2018-06-27 18:42:01 +08:00
    对于服务炸了的厂商的总结:就是不要把鸡蛋放一个篮子
    jmk92
        131
    jmk92  
       2018-06-27 18:42:43 +08:00 via iPhone
    CDN+OSS,cdn 有鉴权,查看控制台的 httpcode 监控,瘫痪了半个小时。。。
    tingyunsay
        132
    tingyunsay  
       2018-06-27 18:48:38 +08:00
    @1yndonn3u #118 就是挂在百度云的一些公司基本上都 404 了几天,具体的就不说了,我们就是用的百度云,花了一整个晚上恢复线上环境,重新部署代码,后续慢慢恢复后端任务....
    jimages
        133
    jimages  
       2018-06-27 18:59:02 +08:00 via iPhone
    这下好了...本来两地三中心灾备...对各种故障信心满满…没想到阿里云崩了
    janxin
        134
    janxin  
       2018-06-27 19:02:06 +08:00 via iPhone
    @jimages 你放在一个云里就是不行
    1yndonn3u
        135
    1yndonn3u  
       2018-06-27 19:05:33 +08:00
    @tingyunsay #132 私信说说,好想了解下。
    1yndonn3u
        136
    1yndonn3u  
       2018-06-27 19:06:24 +08:00
    @tingyunsay #132 好想不能私信,说下具体几月几号?想了解下,说下啊,老哥。
    rootit
        137
    rootit  
       2018-06-27 19:20:40 +08:00
    业务代码已经高度依赖一个云中的服务了,比如 OSS 已经集成。。。
    Voichesapete
        138
    Voichesapete  
       2018-06-27 19:34:45 +08:00 via Android
    这就是为什么要混合云、多云
    liprais
        139
    liprais  
       2018-06-27 19:39:47 +08:00 via iPhone
    五个 9 泡汤了
    yanest
        140
    yanest  
       2018-06-27 19:49:41 +08:00
    从昨天开始就 DNS 故障,智能解析部分地区无法解析,自己的公共 dns 自己都解析不了
    tiantianjiaban
        141
    tiantianjiaban  
       2018-06-27 19:52:21 +08:00
    连续性业务还是要上多云呀
    feverzsj
        142
    feverzsj  
       2018-06-27 20:25:43 +08:00
    哈哈,这个比放机房还要惨得多,阿里号称国内第一,修复速度这么慢
    guoyuchuan
        143
    guoyuchuan  
       2018-06-27 20:32:10 +08:00
    我同事刚吹逼说他用阿里云,秒进后台,结果打脸了,哈哈哈哈;原来如此
    MOmc
        144
    MOmc  
       2018-06-27 20:32:50 +08:00 via iPhone
    实习生误删登录服务???
    tgyday
        145
    tgyday  
       2018-06-27 20:42:21 +08:00
    这个锅看下最终得主是谁
    fish267
        146
    fish267  
       2018-06-27 20:51:37 +08:00 via Android
    vip
    byuc
        147
    byuc  
       2018-06-27 21:04:15 +08:00
    赔偿?大家当什么事都没发生过
    tingyunsay
        148
    tingyunsay  
       2018-06-27 21:17:21 +08:00
    @1yndonn3u #136 这也没啥好说的,7 号下午两三点吧.....
    gleymonkey
        149
    gleymonkey  
       2018-06-27 21:27:42 +08:00
    还 tm 罗汉堂,还 tm 探寻人类未来,连自身基础都做不好。
    xiaqi
        150
    xiaqi  
       2018-06-27 21:40:14 +08:00 via Android
    妈耶,上公司刚把我裁了,私有云不搞了,迁到阿里云。这下就出事了。哎,🙃🙃🙃🙃
    wdlth
        151
    wdlth  
       2018-06-27 21:57:01 +08:00
    怪不得今天用阿里云的 maven 一堆错
    opengps
        152
    opengps  
       2018-06-27 22:17:14 +08:00 via Android   ❤️ 1
    换个角度理解,云的高可用不是不出错,而是小错误隐藏了到后端了,大错误出一次就是狠的
    jsq2627
        153
    jsq2627  
       2018-06-27 22:23:49 +08:00
    OSS 挂了,公司内网也炸了一堆应用😂
    applehater
        154
    applehater  
       2018-06-27 22:44:10 +08:00
    @orzcc 国内的微软 Azure 日常帮用户重启系统也见多少人抱怨,看来没几个人用
    @1yndonn3u
    0xff0x77
        155
    0xff0x77  
       2018-06-27 22:47:33 +08:00
    今天 OSS 挂了,还以为 CDN 出问题了。
    DZBM
        156
    DZBM  
       2018-06-27 22:48:06 +08:00 via Android
    去年 AWS S3 大面积故障很好的说明了,越是以为很安全放松警惕的地方越容易出大乱子。阿里这次的问题肯定也有深层次系统系性原因,坐等官方故障报告。
    webjin1
        157
    webjin1  
       2018-06-27 23:12:02 +08:00
    digitalhaha
        158
    digitalhaha  
       2018-06-27 23:15:02 +08:00
    肯定是实习生
    york1996
        159
    york1996  
       2018-06-27 23:31:18 +08:00
    感觉是被黑了
    yangqi
        160
    yangqi  
       2018-06-28 00:06:58 +08:00
    @webjin1 和这个没关系,都三周前了,还是小道消息
    wenghuan
        161
    wenghuan  
       2018-06-28 00:22:05 +08:00
    实习生背埚
    mogutouer
        162
    mogutouer  
       2018-06-28 00:38:58 +08:00   ❤️ 5
    qcloud
        163
    qcloud  
       2018-06-28 01:10:56 +08:00 via iPhone
    @mogutouer 哈哈哈,图收藏了
    qcloud
        164
    qcloud  
       2018-06-28 01:11:21 +08:00 via iPhone
    欢迎使用腾讯云,www.qcloud.com
    yexm0
        165
    yexm0  
       2018-06-28 01:22:55 +08:00   ❤️ 1
    mytsing520
        166
    mytsing520  
       2018-06-28 08:35:45 +08:00
    研发、代码审计、运维联合背锅呵呵哒
    hpayton
        167
    hpayton  
       2018-06-28 08:44:50 +08:00
    官方出公告了,可以发起赔偿了
    460881773
        168
    460881773  
       2018-06-28 09:18:20 +08:00
    @hpayton 怎么发起赔偿
    hhh
        169
    hhh  
       2018-06-28 09:49:24 +08:00
    回应还算得体
    1yndonn3u
        170
    1yndonn3u  
       2018-06-28 10:13:41 +08:00
    不知道系统有没有小流量过程。
    hpayton
        171
    hpayton  
       2018-06-28 11:07:51 +08:00
    @460881773 SLA 每个月会统计,系统里会给出赔偿方案
    mytsing520
        172
    mytsing520  
       2018-06-28 12:11:30 +08:00   ❤️ 1
    从阿里内部人处弄来的信息(来源是马哥运维公众号):
    我刚看了下 GOC,这次故障影响了阿里整个集团,包括阿里云、蚂蚁、天猫、飞猪、优酷等 BU、阿里云那边的故障等级是 S1,蚂蚁这边受影响的是 P3。具体原因是一个 core 应用拉 vip 列表的时候,返回了空列表,导致把几千个 vip disable 了,直接影响了整个集团,阿里云只是其中一个受影响的

    线上业务故障 /事故的级别定义如下:
    S0 核心业务重要功能不可用且大面积影响客户;造成巨量损失 响应和恢复时间:立即
    S1 核心业务周边功能不可用,影响部分用户,造成一定损失 响应和恢复时间:小于 15 分钟
    S2 核心业务周边功能不可用,持续鼓掌将大面积影响用户体验 响应和恢复时间:小于 30 分钟
    S3 周边业务功能不可用,轻微影响用户体验 响应和恢复时间:处理和恢复 4 小时
    S4 周边业务功能不可用,但基本不影响不用正常使用 响应和恢复时间:小于 6 小时
    qiudays
        173
    qiudays  
       2018-06-28 13:15:11 +08:00
    强。。
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   4774 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 01:09 · PVG 09:09 · LAX 18:09 · JFK 21:09
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.