我做了一个 Agent Team 协作平台——Rudder:让 Agent Team 在实践中成长

7 小时 5 分钟前
 Zeeland4v

最近在开发 Rudder ,一个给重度 agent 用户使用的 Agent Team 协作平台。

项目地址:

如果你已经在高频使用 Codex 、Claude Code 、Cursor ,或者已经开始维护自己的 Agent Skill ,Rudder 解决的是下一阶段的问题:

Agent 不只是完成任务,还能在真实任务、review 和 feedback 里持续迭代自己的能力。

Rudder 把 goals 、issues 、agent runs 、reviews 、feedback 、skills 和 learning 串成一个 work loop 。一次 agent run 结束后,不只留下 transcript ,还会留下可追踪、可 review 、可沉淀、可回滚的学习记录。

我自己现在高频用 Codex 、Claude Code ,也开始大量使用 Agent Skill 。单次执行已经很强。改代码、查 API 、写说明、修 CI ,这些都能做。很多 know-how 也确实可以沉淀下来。

但用久了以后,麻烦的是这些问题:

一些可能的情况:一条 review feedback 可能是团队长期原则,也可能只是这次任务的临时要求。一个成功经验可能值得沉淀成 skill ,也可能只适合留在这次任务里。一个 skill 被启用以后,也不代表它真的让 agent 做得更好。它可能误触发,可能拿错 source of truth ,可能增加上下文成本,也可能把旧判断带回新任务。

在这个基础上,Rudder 是 agent team 在实践中成长的运行层:一边推进真实工作,一边把团队的流程、偏好、判断标准和 skill usage 变成可复用的能力资产。

举个例子

比如一次 release 任务失败了。

普通 agent 工具可能最后留下 transcript 、错误日志和一句总结:“下次发布前要更小心。”

这句话没什么用。

Rudder 会更关心这些东西:

这样一次失败就不是“又失败了一次”,而是 agent team 的一次训练样本。

和 GitHub Issues + Claude Code + 一堆 Skill 有什么区别?

这个问题很关键。因为我自己也在用这些东西。

GitHub Issues / Linear 能管理任务,但它们不太关心 agent 在这次任务里学到了什么。

Codex / Claude Code 很适合执行任务,但 run 结束后,feedback 、review 、失败模式和 skill 更新很难自然进入下一次工作。

Agent Skill 能沉淀经验,但 skill 本身也会变成问题:

Rudder 把这些 agent 的执行过程放进一个可追踪、可 review 、可沉淀、可回滚的工作循环里。

欢迎试用、star 和提 issue

Rudder 还在快速迭代中,欢迎大家提供反馈!

github.com

如果你也在重度使用 agent ,欢迎试用、star ,或者直接拿自己的 agent workflow 来挑战这个设计。

欢迎大家反馈,最后也想听听大家的讨论!

  1. 你平常开发的时候用的 Agent Skill ,主要是自己搭建的,还是去网上找好用现成更多?
  2. 你如何评价自己平常使用的 agent skill ,会去跑 evaluation 吗?
  3. Agent Skill 多了以后,你们如何处理 skill 越写越长、越写越乱、过度收敛的问题?
  4. 你们现在怎么判断一条 feedback 应该进 memory 、skill 、workflow ,还是只留在当前 issue ?
  5. 你们会不会想知道某个 skill 到底有没有让任务成功率变高?
  6. 如果一个工具能记录 run 、review 、learning proposal 、skill update 、eval 和 rollback ,你会觉得这是刚需,还是过度设计?
162 次点击
所在节点    开源软件
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1216037

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX