《说透 Kubernetes 云原生监控》系列文章,交流收藏

2022-10-04 21:11:16 +08:00
 laiwei

云原生监控系列文章:《说透 Kubernetes 云原生监控》

连载:《说透运维监控系统》

注:

  1. 以上系列文章,均以开源监控系统——夜莺监控为例,你也可以对照 Prometheus 或者 zabbix 做相关的理解。

  2. 基于夜莺监控制作的一些 dashboard ,可以参考如下:

  • K8s apiserver dashboard with nightingale
  • K8s scheduler dashboard with nightingale
  • K8s controller manager dashboard with nightingale
  • K8s etcd dashboard with nightingale
2945 次点击
所在节点    推广
13 条回复
LeoJ
2022-10-04 21:23:48 +08:00
支持一下 open-falcon~
laiwei
2022-10-04 21:57:33 +08:00
@LeoJ :) 云原生监控,open-falcon 稍微有点力不从心(更适合物理机时代),夜莺监控是更好的选择了
crazychang
2022-10-04 22:42:23 +08:00
收藏即学习
YaakovZiv
2022-10-04 23:01:35 +08:00
除了微信公众号,还有其他地方可以看吗,微信公众号加载挺慢的,有你们自己的博客网站吗
laiwei
2022-10-04 23:21:49 +08:00
@YaakovZiv 系列文章都会在公众号上发,公众号是 flashcats 。

不过也会在 https://n9e.github.io 和 http://flashcat.cloud 上做归档。
pavelpiero
2022-10-05 07:00:48 +08:00
原生监控只是开始 后续需要做针对性地开发
plko345
2022-10-05 12:17:42 +08:00
为什么不用云原生的 prometheus ,国际化一点
laiwei
2022-10-05 17:46:38 +08:00
@plko345 Prometheus 是一个挺好的工具,但是也存在一些痛点:

1. ‌功能相对单一,产品化程度低,难以开箱即用;
> 举个例子:可视化一般必须配合 grafana 来工作,告警一般也需要配合 alert manager 来一起工作,且告警策略的改动都需要修改配置文件。夜莺监控把数据采集、可视化、告警管理这些基本能力,都做成了 all-in-one 的产品化方案。

2. ‌数据量过大时,官方缺乏合适的扩展性方案;

3. ‌多集群管理功能缺失;
laiwei
2022-10-05 17:49:07 +08:00
@pavelpiero

是的,业务层面的监控,很多需要在业务代码层面主动埋点(不过好消息是埋点的工作量,借助于 open telemetry ,已经可以降低到足够低了,且都是标准化的方案)

但是对于各种基础设施、中间件、云资源,这些监控,不需要百花齐放百家争鸣,尽可能选择最佳实践,开箱即用是更好的。
laiwei
2022-10-11 12:37:53 +08:00
看到很多 v 友收藏,谢谢,我会继续 append 这个主题。
wsszh
2022-10-28 18:50:43 +08:00
支持
wuleiisme
2022-10-30 19:47:32 +08:00
看起来挺不错,最近正好有需求
laiwei
2022-10-30 21:00:45 +08:00
追加一篇文章《 Zabbix 和夜莺监控选型对比》 http://flashcat.cloud/blog/zabbx-vs-nightingale/,来自 Zabbix 社区专家张世宏,张世宏也是 Nightingale 社区活跃贡献者。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/884658

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX