如何看待 2021.07.13 B 站崩溃事件

2022-07-15 08:39:10 +08:00
 Stendan

分析报告: https://www.bilibili.com/read/cv17521097

14787 次点击
所在节点    哔哩哔哩
103 条回复
Zerek
2022-07-15 11:25:00 +08:00
7 月 13 ?定眼一看哦。。。2021
wanacry
2022-07-15 11:29:25 +08:00
昨天我家里的洗衣机修好了
wangyzj
2022-07-15 11:41:05 +08:00
这个文章就说明 B 站最基本的运维流程都没有,还是几个关键人物在支持,核心组件没有冗余,问题还很多

但归根结底,搞运维嘛
没事的时候你是成本
有事的时候是你的责任
给运维花钱总觉得亏得慌
又让马儿跑,又不给吃草
做得好是让自己失业,做的不好就得背锅一样失业

总之,运维,都这个 B 样
abuabu
2022-07-15 11:41:15 +08:00
为什么一个很好能够讨论技术的帖子会被冷嘲热讽?
lookStupiToForce
2022-07-15 11:43:26 +08:00
v2 上还有玩鄙视链的
真是有人的地方就有恶臭的圈子习气
nyakoy
2022-07-15 11:48:29 +08:00
堪称精彩,但是代码得防御边界做的如此弱确实没想到
Baloneo
2022-07-15 11:56:36 +08:00
要么用电脑看 要么手机看
crazytudou
2022-07-15 11:57:26 +08:00
逼乎:你怎么看?
mmnnyycc
2022-07-15 12:03:01 +08:00
@qping #18 openresty 商业公司,春哥说的 100%无侵入式的
mmnnyycc
2022-07-15 12:04:48 +08:00
几分钟前章亦春说的原话:
B 站这两天发表了一篇总结去年那场大事故的文章: https://mp.weixin.qq.com/s/nGtC5lBX_Iaj57HIdXq3Qg 当时我们 OpenResty Inc 公司团队帮助 B 站在线上快速定位了导致 CPU 100% 的 Lua 代码路径。B 站是我们的 OpenResty XRay 产品的商业客户。

文中提到的 Lua 火焰图就是 OpenResty XRay 在 B 站生产服务器上采样有问题的 OpenResty 服务进程得到的。生成火焰图也就花了几分钟的时间,因为使用 100% 非侵入的动态追踪技术,并不需要对 B 站的进程进行任何修改。根据 Lua 火焰图最终确认根源问题是 B 站的业务往 Redis 服务器里写入了个字符串类型的权重 0 值的坏数据(即 “0”),而 Lua 代码期望的是数值类型的权重值,从而导致了无限递归和无限循环。文中提到的 LuaJIT 的 JIT 编译器的问题其实并不存在; JIT 编译器在这里并没有 bug 。

感谢 Bilibili 对我们公司产品和技术的信任和支持!当然,B 站线上系统使用的也是我们的开源 OpenResty 软件。OpenResty XRay 产品主页: https://openresty.com.cn/cn/xray/
Morii
2022-07-15 12:20:09 +08:00
@shyrock #24

要分锅的,开复盘大会。
dxppp
2022-07-15 13:13:47 +08:00
官方微信公众号也发了相同的文章
https://mp.weixin.qq.com/s/nGtC5lBX_Iaj57HIdXq3Qg
VZXXBACQ
2022-07-15 13:33:22 +08:00
技术讨论文章为什么会有这么多莫名奇妙的回复?怎么看待不是很正常吗?

弱类型真不行。
Huelse
2022-07-15 13:38:41 +08:00
LUA 这种弱类型语言在这种地方真的要命
siweipancc
2022-07-15 13:47:30 +08:00
草,又是弱类型
edward1987
2022-07-15 14:19:55 +08:00
主题值得讨论,但是能别用逼乎标题吗。。。不喜欢
edward1987
2022-07-15 14:21:11 +08:00
只要有无限递归的可能,我觉得最好都打个日志,配个上限。。。曾经也遇到过😂
zapper
2022-07-15 14:33:01 +08:00
@VZXXBACQ #52 没看出来哪里讨论技术,lz 甚至没有自己的观点。
maguowei
2022-07-15 14:39:08 +08:00
@mmnnyycc 这个有原文出处么?还是来自非公开的信息源?
VZXXBACQ
2022-07-15 14:40:21 +08:00
@zapper LZ 附上的文章是很不错的一线技术讨论,分享出来问大家如何看待有什么问题吗😂

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/866300

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX