[开源分享] Browsernode: Node.js / TypeScript 的 AI 浏览器 Agent(100% 兼容 browser-use)

50 天前
 jackhatedance

最近在折腾 LLM 让它自己“上网干活”,结果发现浏览器这关很容易卡住。
browser-use 虽然好用,但我们是全 TypeScript 技术栈。
索性自己动手整了一个 —— Browsernode,直接用 TypeScript/Node.js 重写,功能和 API 100% 兼容browser-use
而且对开发者更友好,开箱即用。现在开源出来,给有同样需求的同学用。

项目简介

Browsernode 是一个用 TypeScript/Node.js 实现的 AI 浏览器 Agent 库,可以让 LLM / Agent 控制真实浏览器执行各种自动化任务。

为什么会做它?

我们很喜欢 browser-use,并且最初就是用它。但在实际项目中,我们的整个链路是 TypeScript/JavaScript ,于是干脆 从零用 TS 重写,带来:

它能做什么?

让 LLM / Agent 用自然语言或函数调用的方式操作浏览器,比如:

主要特性

快速上手

npm install browsernode
# 安装 Playwright ( Chromium )
npx playwright install
import { Agent } from "browsernode";
import { ChatOpenAI } from "browsernode/llm";

const llm = new ChatOpenAI({
  model: "gpt-4.1",
  temperature: 0.0,
  apiKey: process.env.OPENAI_API_KEY,
});

const task = "对比 gpt-4o 与 DeepSeek-V3 的价格";
const agent = new Agent({ task, llm });
const history = await agent.run();

.env

OPENAI_API_KEY=

更多用法见文档:docs.browsernode.com

链接

这个库我们内部已经用 4 个多月,稳定性和功能都踩过坑。
如果你在做 AI Agent / RPA / 浏览器自动化,欢迎试用、提建议,或者直接在 GitHub 开 Issue 交流。

1333 次点击
所在节点    程序员
3 条回复
songsongqaq
50 天前
赞一个
virjay
49 天前
能不能过机器人检测
jackhatedance
49 天前
@virjay Browsernode 提供了 patchright 代替 Playwright 的方案,patchright 在正确配置下可以通过 Cloudflare 、Kasada 、Akamai 、Shape/F5 、Bet365 、Datadome 等的检测。至于特定的网站的验证,比如 amazon 等,可以在 Browsernode 中配置 2Captcha 之类的验证码解决方案的 api ,这个在 browsernode 的 github 的 exmaples/custom-functions 下有 demo

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1150977

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX