最近在开发 Rudder ,一个给重度 agent 用户使用的 Agent Team 协作平台。
项目地址:
如果你已经在高频使用 Codex 、Claude Code 、Cursor ,或者已经开始维护自己的 Agent Skill ,Rudder 解决的是下一阶段的问题:
Agent 不只是完成任务,还能在真实任务、review 和 feedback 里持续迭代自己的能力。
Rudder 把 goals 、issues 、agent runs 、reviews 、feedback 、skills 和 learning 串成一个 work loop 。一次 agent run 结束后,不只留下 transcript ,还会留下可追踪、可 review 、可沉淀、可回滚的学习记录。
我自己现在高频用 Codex 、Claude Code ,也开始大量使用 Agent Skill 。单次执行已经很强。改代码、查 API 、写说明、修 CI ,这些都能做。很多 know-how 也确实可以沉淀下来。
但用久了以后,麻烦的是这些问题:
一些可能的情况:一条 review feedback 可能是团队长期原则,也可能只是这次任务的临时要求。一个成功经验可能值得沉淀成 skill ,也可能只适合留在这次任务里。一个 skill 被启用以后,也不代表它真的让 agent 做得更好。它可能误触发,可能拿错 source of truth ,可能增加上下文成本,也可能把旧判断带回新任务。
在这个基础上,Rudder 是 agent team 在实践中成长的运行层:一边推进真实工作,一边把团队的流程、偏好、判断标准和 skill usage 变成可复用的能力资产。
比如一次 release 任务失败了。
普通 agent 工具可能最后留下 transcript 、错误日志和一句总结:“下次发布前要更小心。”
这句话没什么用。
Rudder 会更关心这些东西:
这样一次失败就不是“又失败了一次”,而是 agent team 的一次训练样本。
这个问题很关键。因为我自己也在用这些东西。
GitHub Issues / Linear 能管理任务,但它们不太关心 agent 在这次任务里学到了什么。
Codex / Claude Code 很适合执行任务,但 run 结束后,feedback 、review 、失败模式和 skill 更新很难自然进入下一次工作。
Agent Skill 能沉淀经验,但 skill 本身也会变成问题:
Rudder 把这些 agent 的执行过程放进一个可追踪、可 review 、可沉淀、可回滚的工作循环里。
Rudder 还在快速迭代中,欢迎大家提供反馈!
如果你也在重度使用 agent ,欢迎试用、star ,或者直接拿自己的 agent workflow 来挑战这个设计。
欢迎大家反馈,最后也想听听大家的讨论!
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.