没用过 opus4.6 + agents + skills + mcp 组合的人不足以谈 AI 编程

我知道这个标题很冲，但我说的是真心话。

今天看到"AI 编程不过如此"的帖子，点进去一看，不是在吐槽不准，就是在说离做的好差很远。说实话这些我都经历过，去年我也是这个看法。

但现在的 AI 编程已经完全不是那个东西了。

我现在的工作流大概是这样：

我是项目经理，AI 是干活的工程师团队。

不是比喻，是字面意思。我描述需求和约束，agent 自己读项目源码、理解模块关系、开分支写实现、build 报错自己看 log 改、跑通测试、提 PR 。我 review 完 merge 。一个中等复杂度的功能，从描述到 merge 可能就 20 分钟。

这里面几个关键的东西缺一不可：

1. 模型能力是底座

Opus 4.6 这个级别的模型，上下文理解和代码推理能力跟之前的模型真的不是一回事。不是"更好一点"，是质变。它能在一个几万行的项目里自己翻文件找依赖，写出来的代码风格跟项目一致。之前的模型做不到这个。

2. Agent 是手和脚

光有聪明的大脑没用，得能自己操作。Agent 工作流让模型不再是个对话框，而是一个能读文件、跑命令、看报错、自己迭代修复的执行者。这个差距就像你跟一个人微信聊技术方案 vs 直接让他坐你旁边开电脑干活。

3. Skills 是经验

你可以把特定领域的最佳实践、项目规范、工具使用方法封装成 skill 喂给 agent 。相当于这个"工程师"入职的时候就已经读完了所有内部文档。不用你每次都从头教。

4. MCP 是工具箱

让 agent 能直接操作外部工具和服务——数据库、API 、CI/CD 、各种 SaaS 。不是让你手动复制粘贴中间结果，而是 agent 自己调用、自己处理返回值、自己决定下一步。

这四个东西组合起来，才是 2026 年 AI 编程该有的样子。你拿 2024 年的 Copilot 体验来评价现在的 AI 编程，就像拿塞班手机的体验来评价智能手机一样荒谬。

我不是说 AI 能取代程序员——架构决策、需求判断、代码 review 这些还得人来。但执行层面的效率提升是 5-10 倍，这个不夸张。以前要写半天的东西，现在真的是描述清楚然后等 20 分钟。

所以当我看到有人还在说"AI 编程就是个玩具"的时候，我真的很想问一句：你用的是什么？什么时候的东西？

不是所有 AI 编程都叫 AI 编程。

有同感的吗？或者有人用了完整工具链之后觉得也不过如此的，也欢迎来说说。

xloger

3 月 19 日

那我都用过了还是觉得它有局限。
一般来说是用 Sonnet 4.6 ，Cursor ，SuperPowers 的脑暴，Figma 的 MCP 之类的。

AI 的提升是很大，尤其是新写一些独立的功能时，几乎不咋改或者说说就能优化好。基本就是当我构思好怎么写，让它帮我完成敲代码这件事。
这部分是我觉得 AI 提升最大的，而且会少很多写代码的疲惫感。

但是，一旦是涉及到旧代码重构，或者跟旧代码交互时，它的体现往往会让我很恼火。
比如我发现有两块代码（不同同事写的，在的模块不一样）的逻辑是基本一致的，让它重构整合一下。
效果是惨不忍睹的。它往往都是强行从代码的角度复用了代码，并没有从逻辑上进行分层整理。能跑么，能跑；效果对么，对。但实际上改了不如不改，更耦合难懂了。
这类情况不是第一次发生了。
越这样最后越扑朔迷离难以维护。（虽然人类同事也一样会写屎山）

AI 在我看来，它是一个能让你省事的工具，但它不是一个能帮你省心的工具。
如果自己连思考都交给 AI 了，那这个项目对你来说已经是“失控”的了。反过来说，那这个“你写的”AI 项目跟“别人写的”AI 项目有什么优势呢，那为什么要用“你写的”呢。