V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
imdoge
V2EX  ›  分享创造

个人开发的 AI 扩展助手 + Agent, Alternative to Claude for chrome/Gemini auto browse

  •  
  •   imdoge · 9 小时 17 分钟前 · 188 次点击

    自荐下自己个人开发的浏览器扩展的一个筹备了很久了重要功能模块,Agent S6 发布 beta 版

    功能类似 claude for chrome 和 gemini auto browse ,ai 驱动的浏览器自动化,不用登录即可自定义 apikey 使用,支持各种 llm provider ,自定义 apikey(BYOK)模式下纯前端运行,对话历史/配置信息/请求都在浏览器端,关注你没那么重要的隐私(雾)~

    扩展链接

    自卖自夸一下,Online-Mind2Web 测试用例中,使用 gemini-3-flash 模型测试,达到 leaderboard 的至少 top2/top3 水准(虽然很多类似产品不刷榜),和 claude for chrome 和 tabbit browser 对比了下(其他的 gemini/comet/fellou/manus 我没会员),成功率更高执行速度更快,欢迎有会员的给点对比反馈

    功能

    整个扩展类似各种 ai 侧边栏助手+claude for chrome 这样的 agent 助手的结合,简单说下其他功能

    1. 各种模型 ai 对话-思维链网络搜索/上传文件对话/多选网页标签对话/网页截图对话/网页对话和总结/油管 B 站视频总结/论文和 pdf 总结。 烂大街的功能,没什么好说的,自定义 apikey 使用,网页对话/总结特别之处多个多模态开关,可以根据网页内图片(大图)图文并茂总结。

    2. 数据抓取器,简单说下要获取网页的什么(主要是结构化数据列表),就能输出为表格并导出为 json/xlsx 格式。不是什么大功能,但其中有我的一个小巧思比各种数据抓取库巧妙,看请求能猜到是怎么做的(纯前端,BYOK)

    3. Agent S6 ,本次更新的重要功能,功能类似 claude for chrome 和各种 ai 浏览器的网页自动化,简单沟通控制浏览器自动化操作的,同样支持自定义 apikey 使用,纯前端对话历史/设置/图片文件存储和纯前端请求。 另外可以 oauth 连接各种第三方 apps(gmail/notion/airtable/google sheets 等等),实现浏览器自动化和第三方工具的协同,不过这个是基于 composio 的,apikey 在我后端,所以请求第三方 apps 的那个请求是不能纯前端 apikey 执行的特别说明~

    模型

    使用模型推荐:各家 llm 我都试过,考虑性价比体验最好的是 gemini-3-flash ,又快又准,世界知识还丰富。当然最划算是配置用中转站的白菜价顶级模型(如果能稳定的话)

    其他

    速度: 个人测试体感比其他产品快,网络良好的情况下,gemini-3-flash 约 4-8s/step ,一个小任务半分钟到一分钟就能完成 成本: 目前估计普通网页平均每次请求 1w 多输入 token ,复杂的平台站平均 2w+输入 token ,触发缓存的情况下换算后相当于 1w 左右输入 token ,不会随着访问的页面数/step 数增加,输入 token 大幅线性增加

    欢迎各位使用给我反馈~~

    目前尚无回复
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   959 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 22:09 · PVG 06:09 · LAX 14:09 · JFK 17:09
    ♥ Do have faith in what you're doing.