ykswang

AWS 因为闰秒大面积宕机

  •  1
     
  •   ykswang · Jul 1, 2015 · 11881 views
    This topic created in 3967 days ago, the information mentioned may be changed or developed.
    Twitter上已经各种酸爽了

    47 replies    2016-03-06 00:13:22 +08:00
    longestusername
        1
    longestusername  
       Jul 1, 2015
    闰秒引起宕机的原因是?
    est
        2
    est  
       Jul 1, 2015
    @longestusername 代码里 getSecond() 返回一个60 。。。
    crayygy
        3
    crayygy  
       Jul 1, 2015
    @est 为什么听起来那么喜感。。
    cnZary
        4
    cnZary  
       Jul 1, 2015 via Android
    aws不是不打算添加第60秒而是把这1秒分散嘛
    @est
    renfufei
        5
    renfufei  
       Jul 1, 2015
    只有时间服务器修改下不就好了吗?把1秒拆成2秒。
    MuskWang
        6
    MuskWang  
       Jul 1, 2015
    闰秒:怪我咯......
    blessme
        7
    blessme  
       Jul 1, 2015
    这么脆?
    gamexg
        8
    gamexg  
       Jul 1, 2015
    一直不清楚这种事情到底有什么影响?
    程序上需要做那些特殊处理?
    learnshare
        9
    learnshare  
       Jul 1, 2015
    又不是第一次闰秒,为什么这么脆弱...

    不知道有没有人经历过 千年虫,从 9* 到 00 的 Bug 更严重
    benjiam
        10
    benjiam  
       Jul 1, 2015 via iPad
    jdk有问题 会cpu100%
    hging
        11
    hging  
       Jul 1, 2015
    不是因为这个. 是因为ntp服务- - 内核的原因.
    caixiexin
        12
    caixiexin  
       Jul 1, 2015
    有点疑惑,除了需要重新同步下时间外,闰秒对计算机的影响到底是啥。。
    wy315700
        14
    wy315700  
       Jul 1, 2015   ❤️ 1
    @caixiexin
    @gamexg

    很多关于事务性的东西会崩溃,2012年纽交所就崩溃了。
    事务要求计算机的时间是一直往前走的,而闰秒会把时间回拨一秒。。
    MuskWang
        15
    MuskWang  
       Jul 1, 2015   ❤️ 1
    @gamexg
    @learnshare

    这篇文章有比较好的说明
    http://www.tuicool.com/articles/JnYbaua
    loading
        16
    loading  
       Jul 1, 2015 via Android
    unix 时间遇到闰秒,会出现两个一样的。

    然后就傻逼了…
    wdlth
        17
    wdlth  
       Jul 1, 2015   ❤️ 1
    为何上交所和深交所不崩溃?快崩了拯救股民。
    kamushin
        18
    kamushin  
       Jul 1, 2015
    @wdlth 我国将在北京时间2015年7月1日的7时59分59秒和全球同步进行闰秒调整
    股市还没开
    invite
        19
    invite  
       Jul 1, 2015
    为什么?
    wdlth
        20
    wdlth  
       Jul 1, 2015
    @kamushin 时间不同步,如果在第一秒就发生交易,那么到底是算开盘前还是开盘后呢。很多交易所都调整时间提前或者延后交易时间来避免争议。
    zhengkai
        21
    zhengkai  
       Jul 1, 2015
    昨天刚看到同事发了个 http://toutiao.com/a4600340448/ ,今天就……
    lilydjwg
        22
    lilydjwg  
       Jul 1, 2015
    tt88050643
        23
    tt88050643  
       Jul 1, 2015   ❤️ 1
    我们公司(一交易所)采取的方法是在6月30号晚停止ntp服务,7月1号8点以后,手动ntpdate立即校时,保证开盘前完成闰秒调整,而从今天的记录来看,ntp服务器不会出现07:59:60而是在08:00:00时间点停留两秒。在之前的模拟闰秒的测试中看,主机在接收到闰秒通知后是会重复跑两遍07:59:59。
    em70
        24
    em70  
       Jul 1, 2015 via Android
    @learnshare 千年虫是当时业界集体忽悠外行的,没那么严重,但搞得全世界都如临大敌,很多软件公司都大大的赚了一笔
    ykswang
        25
    ykswang  
    OP
       Jul 1, 2015
    @lilydjwg 我们在AWS的集群网络不通,CPU100%,都是从7:59:59后开始的
    duangaduang
        26
    duangaduang  
       Jul 1, 2015   ❤️ 1
    我们自己的服务器N多负载飙高,影响不小,主要还是我们用的内核版本比较低,哎!
    duangaduang
        27
    duangaduang  
       Jul 1, 2015
    @tt88050643 你们很专业啊!
    lilydjwg
        28
    lilydjwg  
       Jul 1, 2015
    @ykswang 那给点链接去围观嘛。截图又不能点又不能复制文本。
    tt88050643
        29
    tt88050643  
       Jul 1, 2015
    @duangaduang 交易系统对时间进行切片打上时间戳,对时间还是挺敏感的。
    kamushin
        30
    kamushin  
       Jul 1, 2015
    @wdlth 8点-9点,怎么可能还没同步好:(
    easehu
        31
    easehu  
       Jul 1, 2015
    我们公司从今年1月份就开始出通告了,我们在3月份完成所有设备的调查,最后找供应商确认这些设备是否会因为闰秒问题出现问题,最后到4月中旬得到结果,只有两台过保的光纤交换机可能会有问题,其他的机器系统内核都升级到了新版本,网络设备和存储设备都询问过供应商,确定到时没有这个问题。最终给两台光纤交换机搞了个私有的ntp服务器(ntp配置无法去掉,过保没技术支持),在私有ntp上用perl 模拟ntp服务器。早上平稳过度没出现设备宕机和网络中断的情况。
    micyng
        32
    micyng  
       Jul 1, 2015
    @est 不会出现60,而只是59重复一次
    princeofwales
        33
    princeofwales  
       Jul 1, 2015
    半个月前就做好了预案,今早提前到了公司,临时停止了几台数据库服务器的ntp,8点过后再打开,没有发现异常
    我看了一些资料,是说会出现07:59:60,一般的应用当然没问题,timestamp类型的字段就可能有问题了,数据库不认第60秒
    rrfeng
        34
    rrfeng  
       Jul 1, 2015
    不是闰过好几回了吗……第一次就是停了 NTP 然后第二天起
    反正我们的业务时间相关性不是很大。
    alen
        35
    alen  
       Jul 1, 2015
    AWS机器没啥特殊变化,就和平时一样没啥事发生。
    julyclyde
        36
    julyclyde  
       Jul 1, 2015
    @easehu 如果交换机连不上ntp会如何?直接让它访问不了不就得了,为什么还做个假的?
    julyclyde
        37
    julyclyde  
       Jul 1, 2015
    @princeofwales 数据库字段应该可以吧?就怕事务处理受逆转时刻影响
    wy315700
        38
    wy315700  
       Jul 1, 2015
    @julyclyde 那样 交换机时间会永远比其他设备快一秒。。。
    julyclyde
        39
    julyclyde  
       Jul 1, 2015
    @wy315700 闰秒之后再让它能连上就可以慢慢调过来吧。你的假ntpd提供啥数据给它?
    wy315700
        40
    wy315700  
       Jul 1, 2015
    @julyclyde
    估计是内核原因,不支持平滑过度1s这么大的差距,也许可以过度10ms这样的,所以要弄一系列假的NTP数据,诱导他慢慢的过度过来。

    仅个人猜测
    ivanchou
        41
    ivanchou  
       Jul 1, 2015 via Android
    家里的网件路由器昨晚正常,今天老爸打电话说不能上网了,会不会是闰秒造成的?
    YvesX
        42
    YvesX  
       Jul 2, 2015 via iPhone
    AWS 因为闰土大面积宕机
    crystone
        43
    crystone  
       Jul 2, 2015
    刚发现我的一个vps自己重启了 是这个原因么
    yanyandenuonuo
        44
    yanyandenuonuo  
       Jul 2, 2015
    @em70 应该没这么简单吧,99变00对很多软件还是有影响的吧,比如不是盛传WIN9跳票就是为了避免一些软件对WIN95的判断==
    julyclyde
        45
    julyclyde  
       Jul 2, 2015
    @wy315700 那看来交换机内是用ntpdate而不是ntpd
    liuyangmengqi
        46
    liuyangmengqi  
       Mar 6, 2016 via Android
    @em70 当年千年虫事件真的非常,非常严重。你所谓的"忽悠、没那么严重、大赚一笔"的阴谋论,我来给你打个比方:一群气象专家拼命宣传洪水要来了,政府决定大力加固年久失修的堤坝,修好后洪水真来了,幸好堤坝坚固,只漏了一点水,淹了几间草房。结果几个市民开始嘀咕:“这洪水也不怎么厉害嘛,电视报纸上整天吓唬我们,花了那么多钱,肯定有阴谋。”
    应该说,之所以最后没有造成太过严重的后果,正是因为对千年虫危害宣传和防治做的非常彻底,
    liuyangmengqi
        47
    liuyangmengqi  
       Mar 6, 2016 via Android
    @em70 其实就是两句话:
    出现了千年虫问题,"专家"没说话,业界不重视,完全没有做应对措施,最后造成严重后果☞阴谋论:"垃圾,这点事都摆不平,背后肯定有阴谋。"
    出现了千年虫问题,"专家"一起告危,业界非常重视,积极做应对措施,把损害降到了最低☞阴谋论:"其实没多大事,真能忽悠,背后肯定有阴谋。"

    总之无论什么都是阴毛
    呵呵,你开心就好
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   6156 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 351ms · UTC 02:08 · PVG 10:08 · LAX 19:08 · JFK 22:08
    ♥ Do have faith in what you're doing.