如何确认一个程序的状态,比如是否死锁?

2018-03-12 15:11:52 +08:00
 ChristopherWu

因为用到了 celery 做分布式计算,经常出现程序突然一直不打 log,或者接收到 SIGTTERM 挂掉的状态。

pidbox received method revoke(signal=u'SIGTERM', terminate=True, task_id=u'91920c02-e411-4c77-98dd-5f86be24e8ae') [reply_to:None ticket:None]

之前的一个问题我是这样解决的,用 strace 查看,看到了其调用 futex 后便一直无法释放,确认是因为 pymongo 的连接复用导致的死锁。

感觉 strace,ltrace 吊炸天。当然,有时藏得比较深就不好找了。。

请问各位在没有程序 log 的情况下,还有什么办法确认此程序出现什么问题了?

1120 次点击
所在节点    问与答
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/437277

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX