面试题:业务 5XX 激增挂了,如何快速应急?

1 天前
 michael2016
上一篇发的问题还是有很多人参与讨论了,气氛很好,大部分还是理性的,任何技术东西都有利弊,我们深入了解不同场景存在不同的利弊之处,研究透,能够驾驭得住才是真本领,也非常感谢各位的参与,我自己也学习到了很多现在年轻工程师的一些看问题角度和思路。哈哈

咱们接着来:
1. TCP 三次握手和四次挥手的过程,为什么握手是三次,挥手是四次?
2. 讲讲 MySQL 数据库不同引擎类型之间的区别?如何选择?在实际使用过程中遇到什么风险问题?如何调优解决的?举两个应用场景。
3. 数据库突然异常,查看参数内存使用率飚高,从而触发了内存 OOM ,导致主备切换,触发这个 OOM 的可能原因有哪些?说说排查思路。
4. https 和 TLS 的原理是什么?在实际使用过程中遇到什么需要注意的点或风险问题?如何解决的?
5. 业务突然 5XX 了,接口调用报错,如何快速应急?讲讲大致的思路。
6. 传统防火墙管理时间长了会积压很多策略,导致防火墙四层 ACL 处理量大,性能下降或者是存储空间不够,应该如何恰当的管理四层网络隔离?
7. 公司业务要出海,老板通知要满足海外的数据安全合规,如果你是业务负责人,应该如何做?

请理性不带情绪的参与技术讨论,不喜欢不要带情绪,跟自己对话,控制情绪也是职场一个很重要的点。
1355 次点击
所在节点    程序员
8 条回复
NoDataNoBB
1 天前
回滚版本
bob971683
1 天前
1.坚称系统正常,是用户不会用。
2.承认有问题,但肯定是别人的锅。
3.说想修但没工具,束手无策。
4.后悔当初能行动,现在已晚矣。
kiraskyler
1 天前
1 、握手,syn ,ack+syn ,ack ,挥手 fin ,ack ,fin ,ack ,四次挥手因为关闭 tcp 可以单端关闭,也就是 tcp 是双向的,可以关闭一个方向。实际实践中,握手 4 次,挥手 3 次也都是正常的。

3 、oom 发生在一个进程 page fault 缺页异常申请内存但内存不足时,排查需要监控发生 oom 时刻内存占用情况,通常来说专门跑数据库的机器不应该有其他业务抢内存,数据库进程内存也应该长时间保持一个大致的水位线,不会明显波动。需要长时间监控,排查 oom 时刻各进程的内存情况,是其他进程波动还是数据库波动。
liuidetmks
22 小时 46 分钟前
@yushxzh832 半部 YM 治天下
DefoliationM
18 小时 28 分钟前
1. TCP 三次握手和四次挥手的过程,为什么握手是三次,挥手是四次?

老生常谈了,懒得回复了,懂得都懂,现在这个阶段问点 quic 相关的可能更好。

2. 讲讲 MySQL 数据库不同引擎类型之间的区别?如何选择?在实际使用过程中遇到什么风险问题?如何调优解决的?举两个应用场景。

这个确实不知道,MySQL 用的不多。

3. 数据库突然异常,查看参数内存使用率飚高,从而触发了内存 OOM ,导致主备切换,触发这个 OOM 的可能原因有哪些?说说排查思路。

感觉是数据库 bug ,或者 SQL 查询写的有问题,limit 设置不合理或者没用流读数据。如果有 SQL 查询日志可以看看那个时段有哪些 SQL 大概就能排查出来。如果是正常请求,建议提 issue 或者给机器加内存。


4. https 和 TLS 的原理是什么?在实际使用过程中遇到什么需要注意的点或风险问题?如何解决的?

原理?感觉要写很多,先非对称协商对称加密的密钥,之后都是对称加密。目前主流是使用 aead 。注意防着点客户端所在主机被注入恶意的 ca 证书导致 tls 被劫持,http 请求的内容全被监听了。解决方法是加点 edr 或者 waf ?

5. 业务突然 5XX 了,接口调用报错,如何快速应急?讲讲大致的思路。

看情况吧,正常应该会有备用服务,监控检测到异常直接切换过去。

6. 传统防火墙管理时间长了会积压很多策略,导致防火墙四层 ACL 处理量大,性能下降或者是存储空间不够,应该如何恰当的管理四层网络隔离?

盲猜防火墙写的太垃圾了,不会自动合并同一网段的地址。自己写的就优化一下,第三方的就换。


7. 公司业务要出海,老板通知要满足海外的数据安全合规,如果你是业务负责人,应该如何做?


首先坐飞机飞到对应国家,然后创建公司,然后建设机房,最后在机房部署另一套服务,海外的请求都发给这一套服务。
Ketteiron
17 小时 55 分钟前
@DefoliationM #5 第七条不需要实体机房啊,只要是该国家的云服务器就行。
swananan
5 小时 3 分钟前
如果面试有人问我三次握手和四次挥手的问题,我会进一步讨论,为什么 TCP 在这方面设计是有问题,QUIC 的解法为什么更优秀。

https://jt26wzz.com/posts/0003-implement-quic-in-rust/
https://jt26wzz.com/posts/0008-implement-quic-in-rust/
cheng6563
49 分钟前
1.懒得背
2.无脑 innodb ,除非你要有意避开事务。
3.内存配置多了呗
4.懒得背,风险可能是是 SNI 泄露,开 DOH 解决。native 客户端可加验一下证书有效性。
5.看监控,没监控就挨个摸。
6.隔离个毛,内网全开,安全全靠堡垒机
7.海外哪来那么多安全合规,国内都能搞定还搞不定海外?没有墙你甚至不需要当地服务器 IP

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1161005

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX