K8s 发布失败后,大家第一眼先看哪?

10 小时 4 分钟前
 EthanWalkerTech
最近在看 K8s 的发布链路,发现一个挺现实的问题:发布失败以后,每个人下手的位置不太一样。

有人先翻 CI ,看是不是镜像没打出来;有人先看 Helm / Argo CD ,确认资源有没有真正下到集群;也有人直接 kubectl describe pod ,先扫 Events 、Pod 状态、Deployment ;还有人第一反应是去看业务日志。

我有点纠结的是:第一步到底该先确认发布动作有没有真正执行成功,还是直接进集群看 Pod 为什么没起来。

大家平时遇到这种发布失败,一般第一步看哪里?
有固定顺序吗,还是看报错现象临时判断?
1077 次点击
所在节点    程序员
15 条回复
owt5008137
9 小时 5 分钟前
打开 AI ,帮我诊断。。。(🐶
cheng6563
8 小时 55 分钟前
k8s 发布不就是跑命令吗,所以 claude code 一把嗦。
pollux
7 小时 50 分钟前
不是先看日志吗?
beyondstars
7 小时 45 分钟前
kubernetes 资源是互相联系的,从顶层看起,比如 deployment >> replicaset >> pod >> container ,既要看 kubernetes 事件,也要看日志。

不要无脑给 ai 所有权限让 ai 全权控制你的 k8s 集群,出了问题你没法甩锅给 ai 。可以把你认为可疑的但又不理解的信息丢给 ai 。
Mystery0
7 小时 26 分钟前
不是应该看报错信息吗
momocraft
7 小时 7 分钟前
想想怎么让自己不用想
hackroad
7 小时 1 分钟前
每个动作不应该埋点日志?失败了通知对应的动作?
seers
6 小时 52 分钟前
当然是从最底下开始一层层往上了,从现象倒推是最快的
weiwenhao
6 小时 42 分钟前
原则上是先看失败日志,一般都是让 cladue 直接操作 kubectl 帮我分析,cladue 都会让我审批我看命令是查询相关的就直接通过。
winson030
6 小时 21 分钟前
一般出事都会告警,先看告警日志吧。
alexluo1
5 小时 41 分钟前
看甲方群
limusi
5 小时 22 分钟前
claude code + kubectl 90%的情况 1 分钟内能解
cctv6
4 小时 41 分钟前
kubectl get/describe pod/deploy
Frankcox
3 小时 36 分钟前
这个要看 devops ,cicd 做的水平
如果就扔给我一句:“应用发布失败了”
那我首先要看 deployment, pod 的状态,看是集群问题还是应用问题。
locoz
2 小时 38 分钟前
当然是不看啊,这点破事还得需要让我来看的话,那说明 AI 出问题了。正常来说应该是 AI 自己处理完,真碰到什么有风险的操作要决策了才来找我,没风险单纯碰到点小问题都该自己解决。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1222873

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX