爱意满满的作品展示区。
Leo306

让 Claude Code / Codex 直接调用你的 ChatGPT 和 Gemini — auto-chat-cli 开源了

  •  
  •   Leo306 · 1h 52m ago · 95 views

    让 Claude Code / Codex 直接调用你的 ChatGPT 和 Gemini — auto-chat-cli 开源了

    GitHub: auto-chat-cli(如果觉得有用,请点个 Star ⭐)

    第一次开源分享,欢迎交流和建议~


    为什么会有这个工具?

    用 Claude Code 或 Codex 生成内容、批量出图的时候,经常遇到这个尴尬:

    • 本地 Agent 调不到 GPT Plus 的图像生成能力
    • 使用 Brower Use 消耗 token 爆炸
    • 使用 Playwright 登录非常麻烦
    • Gemini 的图像理解和生成也很香,但 API 要单独申请、单独集成
    • 已经有一个登录好的 ChatGPT/Gemini 页面在跑,想直接复用这个登录态

    现有的方案要么需要托管账号密码,要么要接管整个浏览器,侵入性太强。

    auto-chat-cli 的思路更简单:只需要在你自己的 Chrome 里装一个插件,运行一条 init 命令。CLI 即可在本地起一个服务,Agent 把任务丢给服务,插件在你已登录的页面里完成操作,结果写回本地文件。账号密码、Cookie 全程不离开你的浏览器。


    它是怎么工作的?

    Agent / CLI / 脚本
      ↓
    auto-chat 本地服务 (127.0.0.1:17321)
      ↓
    Chrome MV3 插件
      ↓
    ChatGPT / Gemini 页面(你自己已登录的)
      ↓
    data/jobs/<jobId>/outputs/   ← 结果写到这里
    

    快速上手( 3 步)

    第一步:安装 CLI

    npm install -g auto-chat-cli
    

    第二步:初始化

    auto-chat init
    

    这条命令会:

    • 启动后台服务
    • 打开 Chrome 扩展管理页
    • 打印插件下载地址和安装步骤
    • 把 Agent skill 安装到 Claude Code / Codex 的 skill 目录

    第三步:安装 Chrome 插件

    1. 从命令输出的地址下载 auto-chat-extension.zip
    2. 解压到一个固定目录
    3. 打开 chrome://extensions,启用 Developer mode
    4. Load unpacked,选解压后的目录

    iShot_2026-06-28_23.05.08.png

    安装完成后,打开 http://127.0.0.1:17321/ 可以看到任务列表页面。

    iShot_2026-06-28_23.06.43.png


    让 Claude Code 直接发起任务

    装好 skill 之后,在 Claude Code 里直接说:

     用 auto-chat 帮我在 Gemini 生成一张赛博朋克风格的猫咪头像,完成后把图片路径告诉我。
    

    Claude Code 会自己:

    1. 构造任务 JSON
    2. 添加、触发任务
    3. 监听并等待结果
    4. 把输出文件路径返回给你

    iShot_2026-06-28_23.18.51.png

    iShot_2026-06-28_23.19.04.png


    支持的任务类型

    类型 平台 说明
    文本问答 GPT / Gemini 输出 .txt 文件
    图片生成 GPT / Gemini 输出图片文件,自动编号
    图片 + 文本(多模态) GPT / Gemini 带参考图的文本任务,图片直接粘贴到输入框
    Gemini 多图串行 Gemini prompts 数组,按顺序逐张生成

    安全边界

    • 只自动化你自己 Chrome 里已登录的页面,不托管账号密码或 Cookie
    • 不绕过平台限制、验证码或权限机制
    • 任务数据默认写入本地 data/,不上传任何外部服务

    路线图 / 欢迎贡献

    目前已支持:

    • GPT 文本 + 图片任务
    • Gemini 文本 + 图片任务(含多图串行)
    • 图文多模态输入
    • Claude Code / Codex Agent Skill
    • SSE 实时状态推送
    • 并发调度控制

    计划中:

    • Web UI 任务详情页增强
    • 更多 Agent 集成示例( Cursor 、Windsurf )
    • 自动重试策略配置

    欢迎提 Issue 和 PR ,也欢迎告诉我你的使用场景。


    如果这个工具对你有帮助,请给项目点个 Star ⭐,这对我是很大的鼓励!

    GitHub: auto-chat-cli

    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1138 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 17:26 · PVG 01:26 · LAX 10:26 · JFK 13:26
    ♥ Do have faith in what you're doing.