请教一下 Gunicorn 的一些疑惑

2022-06-02 16:48:27 +08:00
 TcDhl
如果 Flask + Gunicorn 长时间运行, gunicorn 的进程不释放,服务器内存就会一直增长, 会造成内存泄漏

然后 gunicorn 有两个参数"--max-requests INT"和"--max-requests-jitter INT", 这两个参数可以定期自动清理"gunicorn 的每个 worker"的进程, 避免服务器 GG

但我有一些疑惑:
1.如果在自动清理的过程中, 有新的请求动作 进行数据库的增删改查, 这个新的请求动作会不会被清理掉
2.如果在自动清理的过程中, 已有的进程内正在进行数据库的增删改查, 这个已有的进程不知道会不会被清理
如果 1. 2. 不会被清理掉, 那这套部署方式应该还比较完美
有木有大佬知道我疑惑的这两点应该要担心么

最终线上部署应该是可以弄成 Nginx + Gunicorn + Gevent + Flask 实现高并发
2655 次点击
所在节点    Python
8 条回复
julyclyde
2022-06-02 17:52:56 +08:00
fgwmlhdkkkw
2022-06-02 17:53:27 +08:00
这编译器铁定有问题,Microsoft 不过如此……()
victorc
2022-06-02 18:02:22 +08:00
这种细节问题,直接去翻代码啊,这是提升技术水平的好办法

就你问题本身,workder 的 max request 到达上限之后,会把当前请求处理完,不接受新连接进来

"Autorestarting worker after current request."
TcDhl
2022-06-02 20:21:21 +08:00
TcDhl
2022-06-02 20:21:38 +08:00
@julyclyde #1
@victorc #3
谢谢两位哥
Kobayashi
2022-06-02 21:36:32 +08:00
Gunicorn 采用 arbiter/manager + worker 管理进程。

arbiter 作为管理者,不断循环,在每轮循环检测 worker 状态,比如杀死超时 worker ,创建新 worker 。
而 worker 负责处理请求,多个 worker 监听在同一个 socket 上接受新请求。worker 模式多样,最简单的就是进程模式和线程模式。

max request 被设计用来限制一个 worker 所能处理的做法请求数量。其初衷是担心代码中内存泄漏,worker 运行一段时间后能被杀死,回收掉内存。

worker 里边也是循环处理新请求。在每次处理请求前,worker touch 一个 WorkerTmp 对象(好像是一个文件来着),更新其时间戳。而 arbiter 每轮循环检测到 worker.tmp ,就明白 worker 空闲有一定时间了,会干掉它。Arbiter.run() 是循环代码,Arbiter.murder_worker() 尝试清理 worker 。

Arbiter 管理 worker 方式基于信号。Arbiter 和 Worker 实例化时都会初始化自己的信号管理函数。总之 arbiter 发送 abrt 或者 kill 信号给 worker ,空转 worker 接受到信号后自杀。( worker 空转是因为其达到最大请求数后不再处理新请求)根据 base worker 中 abrt 信号处理函数,worker 执行了 sys.exit(1) 直接退出。

max requests jitter 是在最大请求数目上加点抖动值,避免所有 worker 同一时间停止接受新请求,服务摊了。不过我觉得请求耗时不大可能完全一样,加不加差不大多。

Gunicorn vs Uvicorn vs Supervisor

Gunicorn 很独特的一点是,它既是一个 wsgi 服务器(对标 Uvicorn ),也是一个进程管理器(对标 supervisor )。所以你看到过 Gunicorn+ Uvicorn 部署 asgi 应用,Uvicorn 作为一个 gunicorn 运行。和 supervisor 相比,Gunicorn 进程管理方式相对较弱,完全基于信号,好像 supervisor 基于 RPC 调用啥的,交互式 shell 管理进程、web page 管理进程一应俱全。

主要相关代码参考 arbiter.py 和 workers/base.py
TcDhl
2022-06-02 22:52:10 +08:00
@Kobayashi #6

谢谢老哥
julyclyde
2022-06-06 10:34:02 +08:00
但是我在 sync worker base 里边没有看到这个功能。没明白咋回事

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/856987

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX