[分享] ClaudeChrome - 在浏览器中启动 Claude/Codex,实现通用智能交互体验

4 月 5 日
 InkXPath

ClaudeChrome 介绍

最近在做一个自己工作流需要的工具,随便起了个名叫 ClaudeChrome (也是蹭蹭热度哈哈)。图标也是暴力结合了几家 logo 的主要设计元素,反正权当项目 logo 先用着了。

众所周知 Anthropic 其实已经实现了一个官方的 Claude for Chrome 插件,但是并没有开源,而且之前也只能给 MAX 订阅用户使用(最近因为 CC 的开源风波,听说政策上有调整),所以就打算自己做一个。而且现在很多时候也会用 Codex ,所以不如先 build 这样的一个基础实现,后面做定制化,以及支持更多浏览器或者 Agent CLI 都很方便。

项目 idea 很简单:把 Claude / Codex / Shell 放进 Chrome 侧边栏( Shell 其实现在还没啥用,因为主要靠自行实现的 MCP Server 实现自动页面交互,主要是给未来一些插件脚本手动调用浏览器接口留空),并把每个 session 绑定到一个真实标签页(使用过程中也可以 rebind 标签页)。这样 Agent 看到的就不再只是你手动贴过去的一点信息,而是当前标签页的页面文本、HTML 、请求、console 等浏览器上下文。

项目特性如下:

还有一个比较重要的点,各个 Agent 都是绑定到本地环境的,所以可以直接让它保存页面信息到本地,或者结合本地的上下文做操作,Agent 的 session 和交互记录之类也都是和正常启动一样保存到本地的。除了 LLM 的 API 调用和浏览器访问,整个链路都是完全在本地运行的,所以比较安全。

如下是一些我录制的应用场景演示,基本上都是一遍过。演示用的是 CC+Opus4.6 ,Codex 也是能跑的。现在 backbone 模型能力真的很强。

2048 游戏操作:这个演示聚焦 ClaudeChrome 在 2048 游戏环境中的持续交互能力:它不会停在一次性读取,而是能围绕视觉元素持续进行长链路操作。

Amazon 商品详情收集:这个演示主要展示 ClaudeChrome 的网页爬取能力,包括处理页面跳转和滚动交互的能力,同时会话始终保持绑定在当前浏览器标签页上。

V2EX 论坛话题总结:这个演示展示了 ClaudeChrome 在 V2EX 页面中爬取论坛内容,并根据用户要求执行 JavaScript 命令的能力。

OpenClaw 展示页风格拟合:这个演示突出 ClaudeChrome 的浏览器扩展能力:它可以模仿现有网站来原生设计相似风格,比传统的手动拷贝样式表更方便,也更准确。

知识摄取与文本选中:这个演示聚焦于与之前 Tapestry 项目的集成:不调用 Tapestry 自带爬虫,也能把页面内容直接写入知识库,同时展示基于页面选中文本触发动作的能力。

更清晰的录制请见项目主页和仓库:

项目主页: https://natsufox.github.io/ClaudeChrome/index-zh.html

仓库: https://github.com/NatsuFox/ClaudeChrome

README: https://github.com/NatsuFox/ClaudeChrome/blob/main/README.md

目前我在功能和实现上做了比较多的工作,在跨平台上还没有做太多测试,暂时只在 Chrome ,以及 MacOS 和 Linux (指在本地启动的 MCP Server ) 上跑过,不过常理上说应该都支持的。

下一步打算优化下 Agent 对 MCP tools 调用的体验,现在如果不显式说 “标签页” 等表达,Agent 经常不会主动意识到是要在浏览器内操作,在上面的 demo 中也能看到这样的问题。后面我加一些 System Prompt 的预设,告诉 Agent 目前它已经进入了浏览器的领域内。

最后,大家如果因为平台不支持,或者跑起来以后有任何大大小小的问题,随便+强烈欢迎提 issue 和 PR ,没有格式之类的要求,只要和项目相关,纯灌水也行。大家能真正用起来,就是项目最大的价值,我会一直维护下去。如果有实际帮助,欢迎大家点点 Star 🌟,这对我来说非常重要 :)


Tapestry 更新发布

顺便也宣传一下之前的 Tapestry 。最近 Karpathy 也发表了关于 LLM Wiki 的讨论,其实最初 Tapestry 的定位几乎就是一个简便的 Agent powered 个人知识库,但看起来并没有产生太大的 impact :)

似乎插入外部链接有些限制,加了个 emoji

卡帕西解锁大模型新玩法!构建个人知识库,“大部分 Token 已经不跑代码了

https://mp.w🤔eixin.qq.com/s/UjaVCyw3lxp4e9zn5b8KQA

显然 ClaudeChrome 可以和 Tapestry 有机结合,将当前在浏览器看的内容直接整合到本地知识库,绕开了对于内置爬虫的需要。我觉得这是一个很不错的组合(自己用着很爽哈哈)。

在首次发布后的一段时间里,已经在细节上做了不少优化,知识库前端效果和实际使用体验上都有了比较大的提升,也专门做了项目主页。后续打算仔细研究一下 Karpathy 提出的架构和范式,将一些有用的 idea 落实到 Tapestry 中。

相关的项目特性更新,基本情况等都写在主页里了,也附上先前在 V2EX 的发帖链接,欢迎大家再来关照一下:

V2EX 帖子链接: https://www.v2ex.com/t/1198796

项目主页: https://natsufox.github.io/Tapestry

仓库: https://github.com/NatsuFox/Tapestry

README: https://github.com/NatsuFox/Tapestry/blob/main/README.md

1357 次点击
所在节点    分享创造
1 条回复
InkXPath
4 月 6 日
大家感兴趣可以用用看🥹,有问题欢迎随时交流!在爬虫,逆向,注册机等方面都很有用,这两天也在积极维护(后续也会持续推进)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1203694

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX