做了一个 AI 工作流 SOTA 诊断 skill,希望能直接基于工作空间给出最优改进方案

4 小时 22 分钟前
 gilgameshcc

先说真话——

发这帖主要是想找几个 fellow ,一起追 Claude Code / Cursor / MCP / agent 这一摊东西的当前 SOTA

我自己用 Claude Code 半年,从 hooks / skills / MCP / subagent 一路跟着出新,但每周还是会怀疑两次"我这套 harness 是不是已经落后了"——你们应该也有过这种感觉。

X 和即刻上人人都在晒 setup ,没人讲「你当前 workspace 在哪一档 / 跟 SOTA 差哪几条 / 下一步先装哪个能消化的」。所以我做了一个工具 lorejump.com但更想做的是建一个小群,30 人左右,互相戳一下姿势。


工具长什么样

两种用法:

轻量看一眼:直接在 lorejump.com 首页输入框聊两句,它跑一个自适应问卷( A 问卷 → B 出分 → C 深聊)给你一个 7 维诊断。看完想深扫再装 skill 。

深扫:在你自己 Claude Code 里装 skill + 配 MCP ,/lorejump-optimize 一下,它扫你的 CLAUDE.md / .claude/ 配置 / 仓库结构 / spec 体系,用你自己的 agent 对照 SOTA 知识库打分 —— 输出 7 维分数 + 落后维度 + 1-3 条"当下能消化、可验证"的下一步(不强推完整 harness 模板让你 copy )。

评分逻辑在 agent 侧,知识库在 MCP 侧(只有 2 个 tool:get_sota_pack 拉 SOTA 画像 + submit_report 回执)。你的代码 / prompt 不离开你的机器

7 个维度:D1 Spec 驱动 / D2 上下文管理 / D3 版本控制 / D4 测试质量 / D5 多 Agent 利用 / D6 文档体系 / D7 工作流自动化( D1 + D5 是我赌的"还没被占据的差异化维度",D3/4/6/7 对齐既有 SOTA )。

跑完一次后再跑 /lorejump-harness,server 会带「自上次以来 N 条新实践、K 条与你相关」的 diff 文本——这是我真正想做的事:演变追踪 + 集体经验,不靠"top X%"这种统计学套路。

承诺:skill 跑出来你觉得没对上你的姿势 / 没给到有用的东西 —— 直接来群里 @ 我,我个人帮你看。范围限 AI 工作流( Claude Code / Cursor / Codex / MCP / skill / subagent / hooks ),我都跑过。我也不会的,我帮你在群里找到会的人。


还没想清楚的 3 个问题

  1. SOTA 怎么定义:现在 1 周扫一次 Claude / Anthropic / Cursor / Codex 官方更新 + 部分活跃 dev 实践,server 直读 markdown 而非 BI schema 。但热点变化更快——要不要做"用户自报实践"反向喂?喂了怎么验真?
  2. W0-W4 阶段识别:skill 现在用扫描信号反推用户 workspace 形态( W0 裸项目 → W4 完整 harness 五层齐全),按当前档推下一步。独立开发 / 团队 lead / 内容创作者关心的事不一样——同一档下要不要分流推荐?
  3. 跑完一次之后凭什么再来:我现在只敢做 H1 diff digest (附在 nudge 文本里,不做独立邮件 / streak / wrapped )。但这够不够拉人回来?还是说就该接受"一次性诊断 + 偶尔回看",不强求留存?

这 3 条都想拉群里聊。


群的规则

怎么进群:楼下回复。我看到就拉群。


不指望刷屏。同样在追 SOTA 的兄弟来一个我珍惜一个,每条回复都会接。

137 次点击
所在节点    分享创造
1 条回复
gilgameshcc
4 小时 8 分钟前
**入群页 + 微信群二维码**:lorejump.com/beta

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1212396

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX