从 Composer 2.5 想到微软再次崛起的可能性

最近我使用了 Cursor 的 Composer 2.5 ，第一感觉是：速度很快，写代码也出乎意料地不错。尤其在最近 GPT 疯狂降智，有时我甚至觉得它比 GPT 更好用。更让人惊讶的是，Composer 2.5 并不是一个从零训练的大模型，而是基于 Kimi K2.5 ，再经过 Cursor 自己的 continued pretraining 、强化学习，以及面向真实 coding agent 场景的后训练改造而来。

这件事很有意思。

过去很多人把 Cursor 这类 AI IDE 看成“套壳”App：底层调用别人的大模型，外面包一层编辑器体验，再通过 prompt 、上下文管理和工具调用做工程优化。按照这种理解，Cursor 的核心价值应该主要来自产品体验，而不是模型能力。

但 Composer 2.5 的出现，让这个判断变得没那么简单。

它说明，一家应用公司不一定只能调用模型。只要它拥有真实的垂直场景、用户反馈、agent workflow 、eval 体系和后训练能力，就有可能在已有开源 checkpoint 之上，训练出非常强的专用模型。

更重要的是，Cursor 的路径并不是孤立完成的。Kimi K2.5 提供了强大的基础模型，Fireworks AI 这类平台提供了托管训练、RL 、推理和部署基础设施，Cursor 则提供了真实软件工程场景和高质量的 coding agent 经验。三者结合起来，降低了垂直模型训练的门槛。

这可能是 AI 行业的一个重要信号：

未来不一定只有 OpenAI 、Anthropic 、Google 、Meta 、Moonshot 这类基模公司才能训练强模型。拥有高价值应用场景的公司，也可能基于开源模型和基础设施平台，训练出适合自己领域的垂直模型。

一、为什么 Composer 2.5 可能比原始 Kimi K2.5 更适合写代码？

Composer 2.5 最值得关注的地方，不只是它强，而是它建立在 Kimi K2.5 这样的 base model 之上，编程能力却比它强得多。

这说明我们不能简单地把模型能力理解为“基础智力”。

Base Model 更像是一个人的通用智力、知识储备和底层能力；后训练则像是给这个人注入某个领域的经验、习惯、方法论和工作流。

一个基础智力很高但缺少真实工程经验的人，未必能成为顶级软件工程师。相反，一个基础智力不错、但长期在真实工程环境中训练的人，可能会变得非常强。

coding agent 真正需要学会的，也不是简单“生成一段代码”，而是一整条工程链路：

理解需求、阅读项目、找到相关文件、决定修改方案、调用工具、运行测试、识别报错、修复问题，最终交付可运行结果。

传统互联网代码数据告诉模型：代码长什么样。

真实工程轨迹告诉模型：软件是怎么一步步做出来的。

这两类数据的价值并不一样。

如果说 Base Model 给了模型“基础智力”，那么 Cursor 的产品场景和后训练，可能给了 Composer 2.5 “软件工程经验”。它未必在所有通用能力上都超过原始模型，但在 Cursor 这个具体工作流里，它被训练得更像一个真正的 coding agent 。

二、Fireworks AI 这类平台正在降低应用公司训练模型的门槛

Composer 2.5 这个案例里，Fireworks AI 也很关键。

如果说 Kimi K2.5 降低了模型基座的门槛，那么 Fireworks AI 这类平台降低的就是训练、推理和部署基础设施的门槛。

过去一家应用公司想训练自己的模型，需要自己解决 GPU 集群、分布式训练、推理服务、RL rollout 、权重同步、弹性扩缩容、成本优化和线上稳定性等问题。对大多数应用公司来说，这几乎是不现实的。

但现在，开源模型提供了强大的起点，基础设施平台提供了托管训练和推理能力。应用公司就不一定需要从零搭建底层系统，而可以更专注于自己真正擅长的东西：

场景、数据、产品、用户反馈、eval 、agent workflow 和垂直领域经验。

这会改变我们对“应用层公司”的理解。

过去的分工是：

基模公司负责训练模型，应用公司负责调用模型。

未来可能变成：

基模公司提供通用基础能力，基础设施平台提供训练和推理能力，应用公司基于真实场景训练垂直模型。

Cursor 的意义就在这里。它不是一个孤立的产品更新，而是一个信号：AI 应用公司正在获得过去只有模型公司才拥有的一部分能力。

三、Cursor 的核心资产可能不是 IDE ，而是软件工程轨迹

很多人过去把 Cursor 看成一个更好用的 VS Code + AI 插件。

但从 Composer 2.5 的角度看，Cursor 的核心资产可能不只是编辑器本身，而是它位于真实软件工程工作流的中心。

一个 AI IDE 每天都会接触大量真实任务：

用户想做什么功能，AI 如何规划，改了哪些文件，调用了哪些工具，哪里失败，人类如何修改，哪些建议被接受，哪些建议被拒绝，最终代码如何落地。

如果这些数据能够在用户授权、隐私合规和合同允许的前提下用于产品改进或模型训练，那么它就不是普通产品数据，而是高价值的 agent trajectory 。

代码库只告诉你结果，trajectory 告诉你过程。

而 AI Agent 最缺的，恰恰是“如何完成复杂任务”的过程经验。

这也是为什么 Composer 2.5 值得被放大。它可能不只是证明 Cursor 的模型团队强，而是在暗示一种新范式：

拥有真实生产工作流入口的应用公司，可能比纯模型公司更容易获得高质量后训练数据。

四、顶级基模公司也在抢应用入口

如果只有 Cursor 这么做，我们可以把它看成一个垂直 AI IDE 公司的特例。

但 OpenAI 、Anthropic 、Google 和微软，也都在大规模进入应用层。

OpenAI 做 Codex 和浏览器，Anthropic 做 Claude Code 和 Claude in Chrome ，Google 把 Gemini 深度整合进 Search 、Chrome 、Workspace ，微软则拥有 Copilot 、GitHub 、VS Code 和 Office 。

表面上看，这些公司是在丰富产品线，从用户那里赚钱。

但对 AI 公司来说，产品还有另一层价值：

产品是数据入口，是 Agent 的运行环境，是任务轨迹的收集器，是模型能力的验证场，也是下一代后训练数据的来源。

浏览器尤其重要。

因为浏览器几乎覆盖了用户的大部分数字行为：搜索、阅读、购物、写文档、使用 SaaS 、查资料、处理工作流。未来如果 Agent 真的能替人完成任务，那么浏览器就不只是一个客户端，而可能是 Agent 的操作系统。

AI IDE 也是同理。

IDE 不只是写代码的地方，而是软件生产过程的核心入口。谁掌握 IDE ，谁就更接近真实的软件工程轨迹。

所以，顶级基模公司做 Codex 、Claude Code 、AI 浏览器，不一定只是为了卖更多订阅。更深层的原因可能是：它们必须拥有应用入口，否则长期会缺少最关键的真实任务数据。

未来真正的竞争，可能是模型能力和应用入口之间的闭环。

五、市场可能低估了工作流入口的价值

最近市场对软件公司的担忧大致是：

AI 会让软件越来越容易开发，软件开发成本下降，SaaS 产品更容易被复制，seat-based 收费模式受到挑战，所以软件公司的估值应该下降。

这个逻辑有合理性。

如果一家 SaaS 公司的价值主要来自“我写了一套别人暂时写不出来的软件”，那么 AI 的确会削弱它的护城河。

但这只是第一层。

还有第二层：

AI 会降低写软件的成本，但不会自动降低获得真实用户、真实场景和真实工作流的难度。

未来真正稀缺的，可能不是代码本身，而是用户每天如何完成真实任务的数据。

如果一个产品只是功能集合，它可能被 AI commoditize 。

但如果一个产品是高价值生产工作流的入口，它的价值可能反而会上升。

GitHub 不是普通代码仓库，而是软件协作入口。VS Code 不是普通编辑器，而是开发者工作台。Office 不是普通办公软件，而是企业知识工作入口。Figma 不是普通设计工具，而是设计协作入口。浏览器也不是普通网页容器，而是数字世界的操作入口。

这些产品在 AI 时代的价值，可能不只是收入，而是它们持续产生真实工作流数据的能力。

六、为什么微软可能被市场重新认识
微软最近股价大跌，但如果这个推论成立，微软是最值得重新审视的公司之一。

微软拥有几乎所有关键资产：

GitHub 、VS Code 、GitHub Copilot 、Azure 、Office 、企业客户、全球开发者生态、大量现金流和顶级工程团队。

过去市场看微软 AI ，更多关注 Azure 增长、Copilot 收入和 OpenAI 合作。

但如果从“工作流数据飞轮”的角度看，微软真正可怕的资产可能是 GitHub + VS Code + Copilot 。

这三者组合在一起，几乎覆盖了软件生产的核心链路：需求、代码、提交、PR 、Review 、Issue 、CI/CD 、部署、Bug 修复和团队协作。

Cursor 都能通过 AI IDE 和后训练能力训练出 Composer 2.5 ，已经让我们看到一个小型飞轮的可能性。那么拥有这些巨大资源的微软理论上可以拥有一个更大的飞轮。

当然，前提是这些数据必须在用户授权、企业合同、隐私保护和法律合规的边界内使用。拥有入口不等于可以随便拿数据训练。

但即便如此，微软拥有的工作流入口本身仍然极其稀缺。

真正的问题不是微软有没有资源，而是微软能不能把这些资产组织成一个清晰的 AI 飞轮。

七、微软过去为什么没体现出这个优势？

一个合理的问题是：既然微软拥有这么多资产，为什么它没有更早做出 Composer 2.5 这样的产品？

可能有几个原因。

第一，微软过去太依赖 OpenAI 。过去几年，微软的 AI 叙事很大程度建立在 OpenAI 之上，它可以通过投资和云合作获得模型能力，所以没有那么强的动力自己把 coding model 后训练做到极致。

第二，大公司组织复杂。GitHub 、VS Code 、Copilot 、Azure 、Office 分属不同产品线。资产很多，但要形成统一飞轮，需要很强的组织整合能力。

第三，企业隐私和合规限制很强。微软服务大量企业客户，企业代码、私有仓库和商业数据都非常敏感。即使它拥有入口，也不能像小型创业公司那样快速试错。

第四，市场过去关注的是商业化，而不是数据飞轮。投资者更容易理解 Copilot 收入、Azure 增长和 Office 提价，却未必会立刻理解“开发者工作流数据会成为下一代 coding model 的核心资产”。

所以，微软的问题不是没有牌，而是它过去可能没有把这些牌组合成一个足够清晰的 AI 飞轮。

八、这不是确定结论，而是一个投资假设

这个推论很诱人，但不能把它当成确定事实。

它有几个重要风险。

第一，Composer 2.5 的成功可能主要来自合成数据、RL 方法和工程优化，而不是 Cursor 的真实用户数据。

第二，真实用户数据未必能合法、合规地用于模型训练，尤其是企业代码和商业数据，限制会非常多。

第三，微软拥有入口，不代表它有组织能力把入口转化为模型能力。

第四，如果未来通用基模公司在没有垂直应用入口的情况下，也能持续训练出极强 coding model ，那么应用数据飞轮的重要性就会被削弱。

第五，股价表现不仅取决于长期逻辑，也取决于买入时机、估值水平、利率、财报、市场情绪和竞争格局。

所以，这不是“微软一定会涨”的结论，而是一个观察框架：

如果 Cursor 持续证明 AI IDE 数据飞轮有效，如果 Fireworks AI 这类平台继续降低垂直模型训练门槛，如果 OpenAI 、Anthropic 继续强化应用入口，如果微软开始自研并推出强 coding model ，如果 GitHub 、VS Code 、Copilot 被整合成统一飞轮，那么市场可能会重新认识微软的 AI 价值。

九、结论：软件公司的价值可能从“软件本身”转向“生产过程”

AI 会让写软件变便宜，这几乎是确定的。

但这不意味着所有软件公司都会失去价值。

真正被削弱的，是那些只靠功能堆叠、缺少工作流入口的软件公司。真正可能变强的，是那些掌握高价值生产过程的软件公司。

Cursor 的 Composer 2.5 之所以重要，是因为它让我们看到：一个 AI IDE 公司，不一定只是应用层公司。它也可能基于开源模型、托管训练平台和真实开发工作流，训练出更强的 coding model 。

OpenAI 和 Anthropic 之所以要做 Codex 、Claude Code 、浏览器，也可能是因为它们意识到：没有应用入口，就很难拥有持续生成高质量任务轨迹的能力。

而微软最特殊的地方在于，它早就拥有这些入口。

GitHub 是代码协作入口，VS Code 是开发者工作台，Copilot 是 AI coding 的用户界面，Azure 是算力和企业基础设施，Office 是知识工作入口。

如果微软能把这些资产真正组织成 AI 时代的数据飞轮，那么它不只是一个被 AI 冲击的传统软件公司，而可能是下一代软件工程模型的重要玩家。

今天市场看到的是：

AI 会降低软件开发成本，所以 SaaS 价值下降。

但未来市场可能看到的是：

AI 会提高真实工作流入口的价值，所以拥有这些入口的软件公司会被重新估值。

Google 之前一度将要收购 Windsurf ，结果最后只收购了它的员工，我觉得这可能是一部败棋，让人不得不怀疑现在 Gemini 在 agent coding 领域的拉垮是不是因为缺少真实用户编程的工作流数据来 RL 导致的（特别是很多测评都说 Gemini 的世界知识不错，这说明它的基模肯定是不差的）。

应用入口

工作流

数据

10 replies • 2026-06-26 00:58:44 +08:00

XTTX

7h 45m ago

哪个工作流是只有微软能做，其他 codex,claude code app 这种 AI agent 干不了的？ google\mis 这种巨头干不过 A 也干不过 O ，连 Cursor 干不过。公司花巨量精力在“安全”和“合规”上面，天然地劣势。

defaw

7h 45m ago

我看到了巨大风险，如果 openai 证明不了自己的稀缺性，只要靠后训练就能做出 gpt5.5 的话，纳斯达克就要完蛋了，懂王早就预料到这一步了吗，派马斯克去收购 cursor 然后干崩纳斯达克完成抄底和卸任。

ryougifujino

7h 33m ago

@XTTX 没说只有微软能做，微软各方面都是 Cursor 的 pro max 版，只是认为它有这方面的潜力

ryougifujino

7h 31m ago

@defaw 确实有这方面的风险，但 OpenAI 的目标应该是 Fable 5 ，这方面光靠后训练应该远远不够

catazshadow

6h 19m ago

TL;DR

Julaoshi

6h 5m ago

copilot 中有了一个微软自己训练的模型“MAI-code-1-flash“，暂时没有试过。

slackerman

4h 42m ago via Android

道理没错，AI 味有点重。说品味是人类的护城河还是有道理的，AI 的内容虽然结构化很强，但是容易抓不住重点，在无关紧要的地方啰嗦

XTTX

3h 41m ago

@ryougifujino 大厂没有机会，一会他们都不真的懂 AI 和用户需要什么。
我给你一个例子：Google gemini 生成一个他认为不符合规则的类似 nsfw 的图片，它直接拒绝
同样的 prompt, codex 会自动修改，打磨，直到生成成功。

这里面两个厂有产品哲学上的不同。微软即使有优势，它也没有机会，这是骨子里的问题

ryougifujino

3h 29m ago

@slackerman 想法和思考是自己的，交给 GPT 写的，肯定有 AI 味，我也觉得有点啰嗦，还是精简过一次的🤣

ryougifujino

3h 27m ago

@Julaoshi 后续看看这个模型能不能慢慢起来了。这个叙事能不能成立也要看 Cursor 能不能持续发布更强的模型。