一个 Python GC 问题,虽然被解决了,但是还是不懂为什么

2020-04-16 10:30:27 +08:00
 aladdindingding

就是我们有一个 redis 的公共文件自定义了一个方法使用了 pipline,举个例子: 比如这个是一次从一个 list 一次 pop 出多个元素

def lpopn(self, name, n):
	"""一次 pop 多个元素"""
    pipe = self.pipeline()
    pipe.lrange(name, 0, n - 1)
    pipe.ltrim(name, n, -1)
    raw_list, is_succ = pipe.execute()
    return raw_list

之前写了一个脚本用来收集 redis 中的数据入库用了这个方法,导致脚本运行时发现了内存泄漏,然后使用内存监控工具定位到了是这个 redis.client.Pipeline 这个对象占用了大量内存,之前记得有 python 的坑说的是 如果在循环引用中的对象定义了 del,那么 python gc 不能进行回收,然后我就点进 pipeline 里面看确实是定义了 del

class Pipeline(BasePipeline, Redis):
    "Pipeline for the Redis class"
    pass
    
class BasePipeline(object):
		# 省略了其他方法
    def __del__(self):
        try:
            self.reset()
        except Exception:
            pass

然后我就改成 脚本里面全局创建一个 pipline 对象传进这个方法,然后问题就解决了,但是不明白这个 pipeline 怎么就循环引用了呢,不知道是不是这个原因,希望有 v 友能解答一下疑惑,给点思路

2361 次点击
所在节点    Python
4 条回复
linw1995
2020-04-16 11:31:21 +08:00
应该是执行 self.reset() 给 pipeline 带来新的引用?导致回收不了
aladdindingding
2020-04-16 13:52:40 +08:00
@linw1995 reset()应该是重置 redis 事务一些参数的 应该没有带来新的引用吧
xiaolinjia
2020-04-16 15:22:53 +08:00
我看他定义了 enter 和 exit 魔法方法。不如试试
with self.pipeline() as pipe: ?
不过我看他代码是一样的,大概是 del 的时候出异常了?导致 reset 没执行?
linw1995
2020-04-17 22:38:25 +08:00
@aladdindingding 你发的代码又不全。建议用 tracemalloc 看看是不是 redis.client.Pipeline, 再用 objgraph 看看又没有被生存周期长的对象引用到。没有就应该是被 `__del__` 给复活了。https://www.python.org/dev/peps/pep-0442/

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/662984

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX