求推荐一个类似god的Linux监控工具

2013-12-06 16:17:11 +08:00
 verfino
腾讯云上跑了个rinetd,每隔一段时间(1-3天不等)就会CPU 100%,kill掉之后重启就恢复正常

Ruby 有个叫 god( http://godrb.com/ )的 gem,用于监控某进程,且当他CPU负荷超过指定值时重启该进程

无奈 腾讯云上 god 也工作不正常 Orz

Linux 运维经验不多,大家推荐个类似 god 的工具呗
4235 次点击
所在节点    Linux
10 条回复
freeznet
2013-12-06 16:41:16 +08:00
之前在腾讯云跑rinetd也是这样,cpu各种100%,于是改用python+twisted写了个简单的转发,cpu瞬间就下去了
verfino
2013-12-06 16:50:12 +08:00
verfino
2013-12-06 16:51:16 +08:00
@freeznet 不知 Python + Twisted 这个方案是否稳定,是否维护成本很低?
mengyang
2013-12-06 19:16:08 +08:00
zabbix
hipeng
2013-12-06 19:58:58 +08:00
nagios
sandtears
2013-12-06 20:35:17 +08:00
一定要用工具么。。。 写shell不好么?
丢到crontab里面,每一段时间运行一次
shell内容:
1. top命令检测CPU占用判断是否继续执行
2. kill 结束进程
3. 重启进程
freeznet
2013-12-06 20:44:53 +08:00
@verfino 稳定性我没有完全的尝试,因为腾讯云账号因为一些原因被封停了,但是使用python转发差不多3天,没有出现过问题,大约有700左右的tcp连接
leopku
2013-12-06 21:21:00 +08:00
推荐monit
verfino
2013-12-06 22:57:53 +08:00
@leopku 谢谢 暂时先用的 monit

@sandtears 是个思路,并且兼容性绝对最好,先试下 monit 行不行,过几天如果出了状况还是自己写shell 因为监控的东西日后可能比较多,并且数据量也特大,所以如果有好用的工具,日后只需配置就可以
verfino
2013-12-07 15:22:57 +08:00
Orz 事实证明 monit 在腾讯云还是依旧 not work

还是自己乖乖写 shell 吧

最后吐槽下 QNMLGBD 腾讯云

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/92084

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX