Ultra-Goal: 解放注意力,一句话让 Agent 跑完超长程任务的 Skill

3 小时 31 分钟前
 Azure99

仓库:https://github.com/Azure99/ultra-goal

superpowers/gsd 这类由 sdd 驱动的工具做严肃需求很好用。但是,如果要做一些超长程/需要调研再实施的任务,还是有一些痛点的:


从 ultra goal 的名字就能看出,它是以目标驱动的,只需要给定一个清晰的目标,但不需要具体实现细节,agent 会在执行时动态调整。(核心提示词只有 1000 tokens 出头,比 readme 都少)

接收到用户目标后,会先在工作环境中探索,然后动态拆解出按阶段划分的 roadmap 。

每执行一个阶段,都有规划、实施、验收、提交四个步骤。主 agent 只做协调,避免频繁的上下文压缩,子 agent 推进工作,并把工作文档落盘。

每做完一个阶段,主 agent 都会根据当前状态,看看是否要修改 roadmap ,比如发现某个方案实际是不可实施的,就可以调整,一切以达成目标为主。


当然,它的缺点一样很大,执行时间长,会巨烧 token ,如果你的目标定的大,一次跑两天都是有可能的(烧掉你十几亿 tokens )。最好在 codex 中使用 gpt 5.5 xhigh 当主 agent ,不差钱子 agent 就继续用 5.5 ,差钱子 agent 就用 5.4mini xhigh 。但主 agent 不能差,实测下来超长程的任务,claude 系还是稍微差点意思,国产模型差距会更大。

最适合的场景就是搓原型/调研+实现,以及做可行性验证。--yolo 跑上就可以去睡觉了,小修小补没必要用,严肃线上需求还是要谨慎放手(当然也可以先做一版、确保跑通 人再仔细 review )。

直接安装

npx skills add Azure99/ultra-goal

SKILL 需要手动触发(为了防止模型自己抽风调用)。描述目标时,不需要描述具体的实现细节,但要仅你最大所能提供端到端的验收方式,比如做 Web 应用,就给它 playwright-cli ,让它跑交互/视觉验收,而不是只跑单测。

198 次点击
所在节点    程序员
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1218896

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX