让 Claude Code / Codex 直接调用你的 ChatGPT 和 Gemini — auto-chat-cli 开源了
GitHub: auto-chat-cli(如果觉得有用,请点个 Star ⭐)
第一次开源分享,欢迎交流和建议~
为什么会有这个工具?
用 Claude Code 或 Codex 生成内容、批量出图的时候,经常遇到这个尴尬:
- 本地 Agent 调不到 GPT Plus 的图像生成能力
- 使用 Brower Use 消耗 token 爆炸
- 使用 Playwright 登录非常麻烦
- Gemini 的图像理解和生成也很香,但 API 要单独申请、单独集成
- 已经有一个登录好的 ChatGPT/Gemini 页面在跑,想直接复用这个登录态
现有的方案要么需要托管账号密码,要么要接管整个浏览器,侵入性太强。
auto-chat-cli 的思路更简单:只需要在你自己的 Chrome 里装一个插件,运行一条 init 命令。CLI 即可在本地起一个服务,Agent 把任务丢给服务,插件在你已登录的页面里完成操作,结果写回本地文件。账号密码、Cookie 全程不离开你的浏览器。
它是怎么工作的?
Agent / CLI / 脚本
↓
auto-chat 本地服务 (127.0.0.1:17321)
↓
Chrome MV3 插件
↓
ChatGPT / Gemini 页面(你自己已登录的)
↓
data/jobs/<jobId>/outputs/ ← 结果写到这里
快速上手( 3 步)
第一步:安装 CLI
npm install -g auto-chat-cli
第二步:初始化
auto-chat init
这条命令会:
- 启动后台服务
- 打开 Chrome 扩展管理页
- 打印插件下载地址和安装步骤
- 把 Agent skill 安装到 Claude Code / Codex 的 skill 目录
第三步:安装 Chrome 插件
- 从命令输出的地址下载 auto-chat-extension.zip
- 解压到一个固定目录
- 打开 chrome://extensions,启用 Developer mode
- 点 Load unpacked,选解压后的目录
安装完成后,打开 http://127.0.0.1:17321/ 可以看到任务列表页面。
让 Claude Code 直接发起任务
装好 skill 之后,在 Claude Code 里直接说:
用 auto-chat 帮我在 Gemini 生成一张赛博朋克风格的猫咪头像,完成后把图片路径告诉我。
Claude Code 会自己:
- 构造任务 JSON
- 添加、触发任务
- 监听并等待结果
- 把输出文件路径返回给你
支持的任务类型
| 类型 | 平台 | 说明 |
|---|---|---|
| 文本问答 | GPT / Gemini | 输出 .txt 文件 |
| 图片生成 | GPT / Gemini | 输出图片文件,自动编号 |
| 图片 + 文本(多模态) | GPT / Gemini | 带参考图的文本任务,图片直接粘贴到输入框 |
| Gemini 多图串行 | Gemini | prompts 数组,按顺序逐张生成 |
安全边界
- 只自动化你自己 Chrome 里已登录的页面,不托管账号密码或 Cookie
- 不绕过平台限制、验证码或权限机制
- 任务数据默认写入本地
data/,不上传任何外部服务
路线图 / 欢迎贡献
目前已支持:
- GPT 文本 + 图片任务
- Gemini 文本 + 图片任务(含多图串行)
- 图文多模态输入
- Claude Code / Codex Agent Skill
- SSE 实时状态推送
- 并发调度控制
计划中:
- Web UI 任务详情页增强
- 更多 Agent 集成示例( Cursor 、Windsurf )
- 自动重试策略配置
欢迎提 Issue 和 PR ,也欢迎告诉我你的使用场景。
如果这个工具对你有帮助,请给项目点个 Star ⭐,这对我是很大的鼓励!
GitHub: auto-chat-cli