因为用到了 celery 做分布式计算,经常出现程序突然一直不打 log,或者接收到 SIGTTERM 挂掉的状态。
pidbox received method revoke(signal=u'SIGTERM', terminate=True, task_id=u'91920c02-e411-4c77-98dd-5f86be24e8ae') [reply_to:None ticket:None]
之前的一个问题我是这样解决的,用 strace 查看,看到了其调用 futex 后便一直无法释放,确认是因为 pymongo 的连接复用导致的死锁。
感觉 strace,ltrace 吊炸天。当然,有时藏得比较深就不好找了。。
请问各位在没有程序 log 的情况下,还有什么办法确认此程序出现什么问题了?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.