卷了一段时间的覆盖率,尝试用 LLM 对单个 PR 做完整的覆盖,结果越来越烧 token 。合规要求不能接 coderabbit 。现在在用 ocr: github.com/alibaba/open-code-review
这个工具用 go 写主要是做处理并发,核心是在 Prompt 模板( MAIN_TASK / PLAN_TASK / RE_LOCATION_TASK / REVIEW_FILTER_TASK ),针对不同语言的规则文档,和 review 用的 agent 工具集定义。
放到 CI 里,跑了一个项目历史累积的 1400 个 PR ,连续跑了十多个小时,只改了 1 ~ 2 个文件几行代码的 PR 有时候都要跑几分钟。
参考 Meta 这套 RADAR (Risk Aware Diff Auto Review) 系统 arxiv.org/pdf/2605.30208v1
让 AI 评估风险,低风险不处理,高风险采用工具跑 Review 转人工审核。
AI 代码审查重点从 LLM 做具体的正确/安全/可维护/性能,转到 MLOps 的风险路由+局部强约束的 LLM 定向审查。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.