复杂的系统怎么统一日志及服务状态监控?涉及到 django、celery、java、socket.io、python 独立程序、第三方程序、linux、windows、android ...

2015-06-01 11:02:11 +08:00
 gamexg

windows 是按需启动的实例,完成后就会被销毁。

从来做过这么复杂的东西,现在原型是运行起来了,但是日志很乱,甚至有的没有。
各个组件之间的接口也很乱,单元测试也还没有啊!!!

基本功能要全部完成了,下一步打算整理重构整个系统,现在想问一下大家有没有什么日志、可用状态监控的方案推荐?

现在追加一个功能最头疼的就是错误处理部分,出错了怎么标识出来,一个任务涉及到多个语言,时长3-120分钟不等...
现在是每个组件都通过django向任务的log字段写日志,出错直接中断整个任务。

但是很多其他组件的日志也没有搜集,状态监控也没有,挂了都不知道...

例如:celery 出现 工作者 卡在那里不接受新任务,也许是跨洋网络不稳定...

现在想把同一用户、同一任务在不同系统的日志全部关联起来,出现问题也好定位。同时还有各个服务状态也需要监控起来,出错好能够处理...

2373 次点击
所在节点    问与答
1 条回复
wklken
2015-06-01 11:56:21 +08:00
进程监控神马的, 上supervisor
错误日志收集, sentry应该够了
业务日志收集? logstash

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/195231

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX