puppeteer 运行一段时间后无法启动

2021-01-18 10:11:54 +08:00
 missz

puppeteer 运行大概一周后,就无法再打开 chrome 进程了,在这期间会非常频繁的打开关闭 browser

重现步骤

以下为伪代码,部分业务处理已移除

    try {
        let proxy = await jsonUtil.getProxy();
        logger.info("proxy", proxy);
        let proxy_server = 'http://' + proxy.ip + ':' + proxy.port
        const launch_options = {
            headless: true,
            ignoreDefaultArgs: ['--enable-automation', '--window-size=1440,1024',
                '--proxy-server=' + proxy_server,
                '--user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36',
                '--disable-extensions'],
            dumpio: true, autoClose: true, devtools: false,
            args: ['--no-sandbox', '--disable-gpu', '--disable-dev-shm-usage']
        };
        browser = await puppeteer.launch(launch_options);
        const pages = await browser.pages();
        if (common.proxyName !== null) {
            await page.authenticate({username: common.proxyName, password: common.proxyPwd});
        }
        await page.setViewport({width: 1440, height: 1024});
        await page.setDefaultNavigationTimeout(45000);
        await page.goto('http://localhost:8085/crackByGt?gt=' + data.gt + "&challenge=" + data.challenge, {waitUntil: 'networkidle0'});
       //Some business processing
    } catch (e) {
        logger.error("error", e)
    } finally {
        await page.close();
        await browser.close();
        logger.info("浏览器关闭完成")
    }

除此之外,还有一个 kill 长时间未关闭的 shell 脚本,目的是杀死超过 12 小时未关闭的 chrome-linux 进程

#!/bin/bash
#please specify the process run time,which you want to kill
run_tim=12
pid=`ps -ef | grep chrome-linux | awk '{print $2}'`
for i in $pid
do
	number=`ps -p $i -o etime | wc -l`
		if [ $number -eq 2 ];then
			tim=`ps -p $i -o etime | awk -F ":" 'NR==2{print $1}'`
				if [ $tim -ge ${run_tim} ];then
					kill -9 $i
				fi
		else
			continue
		fi
done

以下为错误信息:

[2021-01-17T08:00:19.648] [ERROR] jiyan - 异常 Error: Failed to launch the browser process! spawn /opt/bbd_verify_nodejs/node_modules/_puppeteer@5.5.0@puppeteer/.local-chromium/linux-818858/chrome-linux/chrome EAGAIN
TROUBLESHOOTING: https://github.com/puppeteer/puppeteer/blob/main/docs/troubleshooting.md

    at onClose (/opt/bbd_verify_nodejs/node_modules/_puppeteer@5.5.0@puppeteer/lib/cjs/puppeteer/node/BrowserRunner.js:193:20)
    at ChildProcess.<anonymous> (/opt/bbd_verify_nodejs/node_modules/_puppeteer@5.5.0@puppeteer/lib/cjs/puppeteer/node/BrowserRunner.js:185:85)
    at ChildProcess.emit (events.js:311:20)
    at Process.ChildProcess._handle.onexit (internal/child_process.js:273:12)
    at onErrorNT (internal/child_process.js:469:16)
    at processTicksAndRejections (internal/process/task_queues.js:84:21)
[2021-01-17T08:00:19.770] [ERROR] jiyan - 异常 Error: Failed to launch the browser process!
[0117/080019.402868:FATAL:zygote_host_impl_linux.cc(174)] Check failed: process.IsValid(). Failed to launch zygote process
#0 0x5619c2f86b39 base::debug::CollectStackTrace()
#1 0x5619c2ef94c3 base::debug::StackTrace::StackTrace()
#2 0x5619c2f09c80 logging::LogMessage::~LogMessage()
#3 0x5619c2f0a84e logging::LogMessage::~LogMessage()
#4 0x5619c199c59c content::ZygoteHostImpl::LaunchZygote()
#5 0x5619c2ea476a content::(anonymous namespace)::LaunchZygoteHelper()
#6 0x5619c0f678d6 content::ZygoteCommunication::Init()
#7 0x5619c0f67fd7 content::CreateUnsandboxedZygote()
#8 0x5619c2ea3d46 content::ContentMainRunnerImpl::Initialize()
#9 0x5619c2ea1e0b content::RunContentProcess()
#10 0x5619c2ea1f5c content::ContentMain()
#11 0x5619c2ef33d2 headless::(anonymous namespace)::RunContentMain()
#12 0x5619c2ef30bc headless::HeadlessShellMain()
#13 0x5619c04f4a03 ChromeMain
#14 0x7f3f7349f555 __libc_start_main
#15 0x5619c04f482a _start

Received signal 6
#0 0x5619c2f86b39 base::debug::CollectStackTrace()
#1 0x5619c2ef94c3 base::debug::StackTrace::StackTrace()
#2 0x5619c2f866db base::debug::(anonymous namespace)::StackDumpSignalHandler()
#3 0x7f3f78e35630 (/usr/lib64/libpthread-2.17.so+0xf62f)
#4 0x7f3f734b3387 __GI_raise
#5 0x7f3f734b4a78 __GI_abort
#6 0x5619c2f85665 base::debug::BreakDebugger()
#7 0x5619c2f0a0f2 logging::LogMessage::~LogMessage()
#8 0x5619c2f0a84e logging::LogMessage::~LogMessage()
#9 0x5619c199c59c content::ZygoteHostImpl::LaunchZygote()
#10 0x5619c2ea476a content::(anonymous namespace)::LaunchZygoteHelper()
#11 0x5619c0f678d6 content::ZygoteCommunication::Init()
#12 0x5619c0f67fd7 content::CreateUnsandboxedZygote()
#13 0x5619c2ea3d46 content::ContentMainRunnerImpl::Initialize()
#14 0x5619c2ea1e0b content::RunContentProcess()
#15 0x5619c2ea1f5c content::ContentMain()
#16 0x5619c2ef33d2 headless::(anonymous namespace)::RunContentMain()
#17 0x5619c2ef30bc headless::HeadlessShellMain()
#18 0x5619c04f4a03 ChromeMain
#19 0x7f3f7349f555 __libc_start_main
#20 0x5619c04f482a _start
  r8: 0000000000000000  r9: 0000000000000000 r10: 0000000000000008 r11: 0000000000000202
 r12: 00001db7754aedc0 r13: aaaaaaaaaaaaaaaa r14: 00001db7754aedd0 r15: 00007fffdb5a2270
  di: 000000000000217f  si: 000000000000217f  bp: 00007fffdb5a1a20  bx: 00007fffdb5a2290
  dx: 0000000000000006  ax: 0000000000000000  cx: ffffffffffffffff  sp: 00007fffdb5a18e8
  ip: 00007f3f734b3387 efl: 0000000000000202 cgf: 0000000000000033 erf: 0000000000000000
 trp: 0000000000000000 msk: 0000000000000000 cr2: 0000000000000000
[end of stack trace]
Calling _exit(1). Core file will not be generated.
3643 次点击
所在节点    Node.js
14 条回复
guochao
2021-01-18 10:39:39 +08:00
我原来遇到过 chrome 标签无法自己关闭的情况,所以后来是用了 cgroup 啊、timeout 啊之类的工具,来清理 chrome 进程。

你上面贴的信息不足以得到为什么启动不了进程的原因。原因有很多,比如说资源不够了( pid,mem,……)。我没读过 chromium 实现,但是有没有可能是用了同一个 profile ?用同样的参数能不能手动启动一个 headless chromium ?

建议先自己再调研一下
WishMeLz
2021-01-18 10:52:33 +08:00
这个东西我在服务器里面运行不成功,我也不知道什么原因。我只能在我的电脑里面运行
Areym
2021-01-18 11:08:35 +08:00
建议每次只开一个浏览器进程 然后每次新开一个标签页做任务 完事之后关闭标签页 不关闭浏览器
guochao
2021-01-18 11:40:55 +08:00
@WishMeLz 可能性有几个,一个是这玩意儿依赖 X,是不是什么库没有装。另一个是 chromium 带了几种沙箱实现,是不是这几种沙箱都不能正常工作,不能正常工作的话会失败。

@missz 想起来忘了说的一个问题。你加了'--no-sandbox',建议还是不要这个。在代码里面修一下 sandbox 的权限,sandbox 文件的 owner 需要是 root ( puppeteer 解压以后是当前用户,需要 chown ),并且需要 chmod u+s 来让当前用户下执行的程序自动切换到 root (用来配置沙箱环境限制子进程)。而且,对,推荐用 @Areym #2 提到的开标签页做事儿。
lozzow
2021-01-18 11:57:35 +08:00
可以尝试使用 docker 版本的,然后直接退出 docker 来清理资源
Justin13
2021-01-18 12:52:05 +08:00
加参数"--no-zygote"
missz
2021-01-18 13:34:59 +08:00
@Areym 因为需要频繁切换代理 ip,不能给每个标签设置代理
missz
2021-01-18 13:40:20 +08:00
@Justin13 这个好像是不允许 zygote 进程创建 fork 子进程,但是没有在服务器上找到 zygote 相关的进程
libook
2021-01-18 13:42:19 +08:00
我在自己的 Server 上跑 puppeteer 就很难跑起来,这个可能和依赖有关系,比如虽然是 headless 模式,但可能依然依赖一些 GUI 的东西。

再加上缓存管理之类的事情,我后来就换容器搞了,出问题直接回退镜像。

可以直接去找一些可用的 puppeteer 镜像,自己改。
missz
2021-01-18 14:05:22 +08:00
@libook 目前公司所有服务器环境都没有使用 docker,并且这个程序已经上线到正式了,服务器环境相对固定了,换成 docker 上面不会同意
Justin13
2021-01-18 14:40:07 +08:00
@missz
"FATAL:zygote_host_impl_linux.cc(174)] Check failed: process.IsValid(). Failed to launch zygote process"
Itoktsnhc
2021-01-18 14:44:38 +08:00
有一个 browerless 的项目 https://github.com/browserless/chrome 他应该就是集成了很多清理 /重启这些额外的管理功能。我们目前有服务有部分用到他的 docker 镜像,但是没试过自己源码部署
lozzow
2021-01-18 15:34:39 +08:00
@missz 我看了下你的日志关键字,和我们公司使用的是同一个业务场景😂现在公司也是用的物理机部署,用命名空间做隔离,但是后面还是做了 docker 容器化的处理,只是由于线上业务很稳定,没有正式上线,但是容器化之后对于业务扩展和资源控制,有很好的提升
missz
2021-01-18 16:42:08 +08:00
通过核查服务器情况:
1 ):内存、cpu 相对正常
2 ):用户子进程达到系统上限(也是出现异常的原因)
3 ):chromium 所依赖的库确认都有安装

目前的问题:
1 ):kill 进程的脚本似乎会导致 puppeteer 无法再打开浏览器(存疑)
2 ):@Justin13 老哥提出的--no-zygote 需要到测试环境验证一段时间,暂时不能确定是否是该参数的问题
3 ):@Itoktsnhc @lozzow 两位老哥提出的容器化可以解决问题,但是人为环境阻力太大,只能仅限于本地,淦
4 ):@guochao 老哥提出的沙箱环境多次测试目前还是没能启动起来。。。

目前的解决方案

进程满了用脚本重启。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/745801

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX