Python 缓存库， LRU, max, timeout

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 2877 天前的主题，其中的信息可能已经有所发展或是发生改变。

服务性能出现瓶颈，有些逻辑需要多次进行 reids 访问。虽然每次 redis 访问时间较短，但是总体下来网络开销还是吃不消。

现在明确的解决方案是使用进程内的缓存来解决。调研了几个现有的缓存库，都不太满足需求。

repoze/repoze.lru，看文档应该是不支持 timeout
jlhutch/pylru，也是不支持 timeout
stucchio/Python-LRU-cache, 支持 timeout，但是实践发现装饰器不能用在成员函数上

不知道 python 中是否有个缓存组件能够同时支持：

对类成员函数使用装饰器
LRU （提升内存使用效率）
max (防止内存使用过多)
timeout 设置(缓存涉及黑名单，必须要定时从 redis 内重新加载)

如果没有，就只能自己在基于上面的几个缓存组件修改。

缓存

Python

lru

Redis

16 条回复 • 2018-11-13 11:41:00 +08:00

kkfnui

2017-12-14 10:01:42 +08:00

需要功能是和 java guava 库中的 LoadingCache 一样的

cabing

2017-12-14 10:07:28 +08:00

搭个本机的缓存应该就符合你的要求了吧？
比如本机的 redis。或者用 leveldb 在本机重复造个轮子。

kkfnui

2017-12-14 10:12:12 +08:00

@cabing 现在访问的 redis 就是本机的 redis

cabing

2017-12-14 10:27:08 +08:00

性能瓶颈是网络 io ？
如果磁盘 io 低的话，可以使用基于文件的 nosql。

1 如果时间不着急可以自己造轮子啊

2 如果比较急
或者看看能不能找个共享内存的库，你的四点基于轮子去做.

cabing

2017-12-14 10:28:08 +08:00

抱歉啊，实在是不是特别了解 python。只能提供一点点思路，希望能帮到你哦~

kkfnui

2017-12-14 10:35:51 +08:00

@cabing 多谢。

业务逻辑决定了要多次访问 redis。
redis 现在内存量级对应我们的硬件来说是比较大的，慢查询也会出现十几毫秒的情况。

现在是短平快的解决思路

billion

2017-12-14 10:38:44 +08:00

你的这个网络开销，是从 redis 传数据回来的时间，还是 redis 读取的时间？如果是前者，使用异步模型可解。

cabing

2017-12-14 10:42:12 +08:00

@kkfnui
思路一如果只是内存问题的话，建议看看走磁盘的 nosql。做成一个服务，通过 socket 调用，自己封装下就行

思路二 python 开源库，找一个比较原始的能够实现多进程共享内存的组件，其他的业务逻辑可以自己封装。

思路三用 c 重复造个轮子。短平快你是不用考虑了~

mooncakejs

2017-12-14 10:42:16 +08:00

也找不到合适的，最后自己写了一个，发现其实代码没多少行。

VYSE

2017-12-14 10:47:12 +08:00

自己用 PYLRU 改过,选其他一些不成熟实现遇到过坑,比如某用 C 实现 LRU 说自己很快然后 crash 一堆

Kilerd

2017-12-14 12:01:13 +08:00

from functools import lru_cache

kkfnui

2017-12-14 13:17:47 +08:00

@billion
异步模型成本更高

1. 需要修改现在业务逻辑，时间成本高
2. 复杂度、心智负担都会提高

不是万不得已，一般的业务逻辑还是不要采用异步模型

kkfnui

2017-12-14 13:18:26 +08:00

@Kilerd 这个不支持 timeout 吧

kkfnui

2017-12-14 13:18:48 +08:00

@mooncakejs 恩，还是自己写了一个。

Kilerd

2017-12-14 13:59:06 +08:00

@kkfnui 那就自己实现一个咯。

异步处理起来实在是太舒服了，前提是架构合理的情况下。

Buffer2Disk

2018-11-13 11:41:00 +08:00

@kkfnui
最近也在研究这一块，可以讨论讨论，网上找了一个支持 timeout 的 lru_cache , 是基于 python 官方的 orderedDict 实现的，
测试后发现，orderedDict 貌似有内存泄漏的问题 ---> https://stackoverflow.com/a/46935255/2379891
不知道你后来是怎么解决的？