各位 dalao 都用什么样的服务器监控解决方案?

2016-07-21 14:49:59 +08:00
 m31271n

只了解到现在比较常用的监控系统有 Graphite 和 TICK ,自己也写了个 总结 。但总感觉不对,所以特来发帖,请教各位 dalao 都是怎么做的?

3029 次点击
所在节点    程序员
19 条回复
zhangfan
2016-07-21 14:54:58 +08:00
cacti
9hills
2016-07-21 15:04:28 +08:00
现在的开源监控方案,都不是很完美,传统的就不说了,新兴的 TICK ,这个的缺点是 InfluxDB 开源版本以后只有单机版,扩展性&性能非常成问题,其他的 TCK 也比较新兴,可能需要大量的二次开发。 哦中间的 Chrograf 建议换成 Grafana

还有 Prometheus ,这个项目还没来得及了解,看文档还可以

此外这种完整解决方案基本没有了,都是一些零散的模块,需要大量的二次开发和整合,比如 OpenTSDB (只存储时间序列)
knightdf
2016-07-21 15:19:09 +08:00
nagios,graphite
m31271n
2016-07-21 15:23:37 +08:00
@9hills 确实 InfluxDB 0.11 以前还有集群设置的文档,到 0.13 就完全剔除了。马上就要发 1.0 了,希望能再次出现。感谢你的回复。
9hills
2016-07-21 15:39:10 +08:00
@m31271n 集群版用来卖钱了,开源版应该不会有了。

需要自己在业务层做 sharding
c0878
2016-07-21 16:12:52 +08:00
直接买监控宝 自己架设太麻烦
m31271n
2016-07-21 18:01:37 +08:00
@9hills 你所说的在业务层做 sharding ,是指 “针对某一特定部分的业务架设一个 InfluxDB ”,然后再 “针对另一部分的业务架设一个 InfluxDB ” 吗?
daocheng
2016-07-21 18:12:14 +08:00
额。。就用的之前推广的 OneAPM, 我是低端玩家
Tony1ee
2016-07-21 19:02:23 +08:00
只有我看成 dadiao 吗…
huson
2016-07-21 19:20:25 +08:00
zabbix
jhaohai
2016-07-21 19:22:19 +08:00
prometheus ,搭配各种 sd
m31271n
2016-07-21 19:27:20 +08:00
@jhaohai sd 是啥?(就俩字, 很难检索,求告知)
jhaohai
2016-07-21 20:02:29 +08:00
@m31271n 服务发现, prometheus 可以配合 consul , etcd , zookeeper 之类的工具自动获取监控目标
mytsing520
2016-07-21 20:04:45 +08:00
zabbix
shiny
2016-07-21 20:06:46 +08:00
分两块,系统运行状态的监控和应用状态的监控, APM 类以及云服务器自带的系统监控
m31271n
2016-07-21 20:24:06 +08:00
@jhaohai 感谢。
pc10201
2016-07-22 09:10:27 +08:00
小米的监控系统
Ryan817
2016-07-22 11:17:46 +08:00
open-falcon
prometheus
influxdb 0.12 以后的版本就是坑,弃用
m31271n
2016-07-22 14:41:57 +08:00
@Ryan817 谢。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/293946

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX