没用过 opus4.6 + agents + skills + mcp 组合的人不足以谈 AI 编程

3 月 19 日
 dodoa

我知道这个标题很冲,但我说的是真心话。

今天看到"AI 编程不过如此"的帖子,点进去一看,不是在吐槽不准,就是在说离做的好差很远。说实话这些我都经历过,去年我也是这个看法。

但现在的 AI 编程已经完全不是那个东西了。

我现在的工作流大概是这样:

我是项目经理,AI 是干活的工程师团队。

不是比喻,是字面意思。我描述需求和约束,agent 自己读项目源码、理解模块关系、开分支写实现、build 报错自己看 log 改、跑通测试、提 PR 。我 review 完 merge 。一个中等复杂度的功能,从描述到 merge 可能就 20 分钟。

这里面几个关键的东西缺一不可:

1. 模型能力是底座

Opus 4.6 这个级别的模型,上下文理解和代码推理能力跟之前的模型真的不是一回事。不是"更好一点",是质变。它能在一个几万行的项目里自己翻文件找依赖,写出来的代码风格跟项目一致。之前的模型做不到这个。

2. Agent 是手和脚

光有聪明的大脑没用,得能自己操作。Agent 工作流让模型不再是个对话框,而是一个能读文件、跑命令、看报错、自己迭代修复的执行者。这个差距就像你跟一个人微信聊技术方案 vs 直接让他坐你旁边开电脑干活。

3. Skills 是经验

你可以把特定领域的最佳实践、项目规范、工具使用方法封装成 skill 喂给 agent 。相当于这个"工程师"入职的时候就已经读完了所有内部文档。不用你每次都从头教。

4. MCP 是工具箱

让 agent 能直接操作外部工具和服务——数据库、API 、CI/CD 、各种 SaaS 。不是让你手动复制粘贴中间结果,而是 agent 自己调用、自己处理返回值、自己决定下一步。

这四个东西组合起来,才是 2026 年 AI 编程该有的样子。你拿 2024 年的 Copilot 体验来评价现在的 AI 编程,就像拿塞班手机的体验来评价智能手机一样荒谬。

我不是说 AI 能取代程序员——架构决策、需求判断、代码 review 这些还得人来。但执行层面的效率提升是 5-10 倍,这个不夸张。以前要写半天的东西,现在真的是描述清楚然后等 20 分钟。

所以当我看到有人还在说"AI 编程就是个玩具"的时候,我真的很想问一句:你用的是什么?什么时候的东西?

不是所有 AI 编程都叫 AI 编程。

有同感的吗?或者有人用了完整工具链之后觉得也不过如此的,也欢迎来说说。

18896 次点击
所在节点    程序员
160 条回复
ooee2016
3 月 19 日
大致认同这个观点, 但是一个功能 20 分钟有点过分了
JYii
3 月 19 日
@dodoa #18 所以 AI 测试基本上跟 AI 编程已经可以切割成两块了。
就你所举得例子,测试端需要的设计和 token 超出编码阶段。
在今天这个时间点,计划、实现、测试、debug 、部署还挺难。
wsseo
3 月 19 日
马斯克也没用过呢
HappyAndSmile
3 月 19 日
@outman87 真的吗?那开中间的几百块人民币一个月的那个套餐够用吗
shinelamla
3 月 19 日
看完了之后只知道了你的工作流有什么组成部份,但是没有明白具体是怎么样玩得更转的,有具体的例子吗?看着文章是有点布道向的,希望能请教下是怎么将这些东西组合在一起运转的工作流案例 @dodoa
liuhuihao
3 月 19 日
作为前端,设计图还原度还有复杂业务(我们这边是定制化的富文本/内容编辑器)AI 还搞不定。
设计图也接了 mcp ,但是要想还原度高还必须得设计师配合,搞好各种图层叠加之类的,现在的设计图 ai 写出来只能说能看,但是不是所有的项目都只是达到“能看”的水平就够的。
富文本编辑器内部的深度定制之类的,ai 搞得也够呛,一堆问题
layxy
3 月 19 日
gpt5.4 + agents + skills + mcp 也很强,其他体感不弱于 opus4.6
Haku
3 月 19 日
问问配置,Agent 用的啥?
另外 AI 测试感觉不是一般的难。
mosesyou
3 月 19 日
mcp 已经逐渐被淘汰了,我全转 skill+script 了
dodoa
3 月 19 日
NoobNoob030
3 月 19 日
opus4.6 贵 + ccmax 封号 + anthropic ceo 反华先锋被信创命令禁止
strobber16
3 月 19 日
得加钱
xloger
3 月 19 日
那我都用过了还是觉得它有局限。
一般来说是用 Sonnet 4.6 ,Cursor ,SuperPowers 的脑暴,Figma 的 MCP 之类的。

AI 的提升是很大,尤其是新写一些独立的功能时,几乎不咋改或者说说就能优化好。基本就是当我构思好怎么写,让它帮我完成敲代码这件事。
这部分是我觉得 AI 提升最大的,而且会少很多写代码的疲惫感。

但是,一旦是涉及到旧代码重构,或者跟旧代码交互时,它的体现往往会让我很恼火。
比如我发现有两块代码(不同同事写的,在的模块不一样)的逻辑是基本一致的,让它重构整合一下。
效果是惨不忍睹的。它往往都是强行从代码的角度复用了代码,并没有从逻辑上进行分层整理。能跑么,能跑;效果对么,对。但实际上改了不如不改,更耦合难懂了。
这类情况不是第一次发生了。
越这样最后越扑朔迷离难以维护。(虽然人类同事也一样会写屎山)


AI 在我看来,它是一个能让你省事的工具,但它不是一个能帮你省心的工具。
如果自己连思考都交给 AI 了,那这个项目对你来说已经是“失控”的了。反过来说,那这个“你写的”AI 项目跟“别人写的”AI 项目有什么优势呢,那为什么要用“你写的”呢。
catazshadow
3 月 19 日
能用 AI 搞定的项目说明这项目本身也不是什么大不了的东西,重复训练材料里有的东西而已
DiamondYuan
3 月 19 日
@bigxixi

安卓用 scrcpy 连接就行。
你可以让 ai 改 10 个方案,然后没个方案录一个操作视频。
最终人类只需要看视频对比确认 10 个方案哪个修复了就行。
redbeetle
3 月 19 日
@Alias4ck #1 毕竟是生产力革命吗,把人从生产中解放出来
xingchenxf
3 月 19 日
楼主能分享一下你用的是哪个 ide 吗? CC 、Codex 、Gemini CLI 、curcor 、Antigravity ?
用了哪些 skills 、mcp ?
或者有没有工程配置文件,直接发出来?我也想试试。
wyntalgeer
3 月 19 日
@bigxixi 调不了一点,这种场景不要有任何指望。我们的 Android 真机疑难杂症也调不了,真机这一块,如果人类专家都感觉棘手的问题就不用找 AI 浪费时间了,你连构造 Prompts 都没法满意
limbo0
3 月 19 日
@xingchenxf #37 cli 里直接对话就够了
HFX3389
3 月 19 日
@dodoa #6 $250 刀开的吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1199424

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX