ryougifujino

从 Composer 2.5 想到微软再次崛起的可能性

  •  
  •   ryougifujino · 8h 4m ago · 733 views
    最近我使用了 Cursor 的 Composer 2.5 ,第一感觉是:速度很快,写代码也出乎意料地不错。尤其在最近 GPT 疯狂降智,有时我甚至觉得它比 GPT 更好用。更让人惊讶的是,Composer 2.5 并不是一个从零训练的大模型,而是基于 Kimi K2.5 ,再经过 Cursor 自己的 continued pretraining 、强化学习,以及面向真实 coding agent 场景的后训练改造而来。

    这件事很有意思。

    过去很多人把 Cursor 这类 AI IDE 看成“套壳”App:底层调用别人的大模型,外面包一层编辑器体验,再通过 prompt 、上下文管理和工具调用做工程优化。按照这种理解,Cursor 的核心价值应该主要来自产品体验,而不是模型能力。

    但 Composer 2.5 的出现,让这个判断变得没那么简单。

    它说明,一家应用公司不一定只能调用模型。只要它拥有真实的垂直场景、用户反馈、agent workflow 、eval 体系和后训练能力,就有可能在已有开源 checkpoint 之上,训练出非常强的专用模型。

    更重要的是,Cursor 的路径并不是孤立完成的。Kimi K2.5 提供了强大的基础模型,Fireworks AI 这类平台提供了托管训练、RL 、推理和部署基础设施,Cursor 则提供了真实软件工程场景和高质量的 coding agent 经验。三者结合起来,降低了垂直模型训练的门槛。

    这可能是 AI 行业的一个重要信号:

    未来不一定只有 OpenAI 、Anthropic 、Google 、Meta 、Moonshot 这类基模公司才能训练强模型。拥有高价值应用场景的公司,也可能基于开源模型和基础设施平台,训练出适合自己领域的垂直模型。

    一、为什么 Composer 2.5 可能比原始 Kimi K2.5 更适合写代码?

    Composer 2.5 最值得关注的地方,不只是它强,而是它建立在 Kimi K2.5 这样的 base model 之上,编程能力却比它强得多。

    这说明我们不能简单地把模型能力理解为“基础智力”。

    Base Model 更像是一个人的通用智力、知识储备和底层能力;后训练则像是给这个人注入某个领域的经验、习惯、方法论和工作流。

    一个基础智力很高但缺少真实工程经验的人,未必能成为顶级软件工程师。相反,一个基础智力不错、但长期在真实工程环境中训练的人,可能会变得非常强。

    coding agent 真正需要学会的,也不是简单“生成一段代码”,而是一整条工程链路:

    理解需求、阅读项目、找到相关文件、决定修改方案、调用工具、运行测试、识别报错、修复问题,最终交付可运行结果。

    传统互联网代码数据告诉模型:代码长什么样。

    真实工程轨迹告诉模型:软件是怎么一步步做出来的。

    这两类数据的价值并不一样。

    如果说 Base Model 给了模型“基础智力”,那么 Cursor 的产品场景和后训练,可能给了 Composer 2.5 “软件工程经验”。它未必在所有通用能力上都超过原始模型,但在 Cursor 这个具体工作流里,它被训练得更像一个真正的 coding agent 。

    二、Fireworks AI 这类平台正在降低应用公司训练模型的门槛

    Composer 2.5 这个案例里,Fireworks AI 也很关键。

    如果说 Kimi K2.5 降低了模型基座的门槛,那么 Fireworks AI 这类平台降低的就是训练、推理和部署基础设施的门槛。

    过去一家应用公司想训练自己的模型,需要自己解决 GPU 集群、分布式训练、推理服务、RL rollout 、权重同步、弹性扩缩容、成本优化和线上稳定性等问题。对大多数应用公司来说,这几乎是不现实的。

    但现在,开源模型提供了强大的起点,基础设施平台提供了托管训练和推理能力。应用公司就不一定需要从零搭建底层系统,而可以更专注于自己真正擅长的东西:

    场景、数据、产品、用户反馈、eval 、agent workflow 和垂直领域经验。

    这会改变我们对“应用层公司”的理解。

    过去的分工是:

    基模公司负责训练模型,应用公司负责调用模型。

    未来可能变成:

    基模公司提供通用基础能力,基础设施平台提供训练和推理能力,应用公司基于真实场景训练垂直模型。

    Cursor 的意义就在这里。它不是一个孤立的产品更新,而是一个信号:AI 应用公司正在获得过去只有模型公司才拥有的一部分能力。

    三、Cursor 的核心资产可能不是 IDE ,而是软件工程轨迹

    很多人过去把 Cursor 看成一个更好用的 VS Code + AI 插件。

    但从 Composer 2.5 的角度看,Cursor 的核心资产可能不只是编辑器本身,而是它位于真实软件工程工作流的中心。

    一个 AI IDE 每天都会接触大量真实任务:

    用户想做什么功能,AI 如何规划,改了哪些文件,调用了哪些工具,哪里失败,人类如何修改,哪些建议被接受,哪些建议被拒绝,最终代码如何落地。

    如果这些数据能够在用户授权、隐私合规和合同允许的前提下用于产品改进或模型训练,那么它就不是普通产品数据,而是高价值的 agent trajectory 。

    代码库只告诉你结果,trajectory 告诉你过程。

    而 AI Agent 最缺的,恰恰是“如何完成复杂任务”的过程经验。

    这也是为什么 Composer 2.5 值得被放大。它可能不只是证明 Cursor 的模型团队强,而是在暗示一种新范式:

    拥有真实生产工作流入口的应用公司,可能比纯模型公司更容易获得高质量后训练数据。

    四、顶级基模公司也在抢应用入口

    如果只有 Cursor 这么做,我们可以把它看成一个垂直 AI IDE 公司的特例。

    但 OpenAI 、Anthropic 、Google 和微软,也都在大规模进入应用层。

    OpenAI 做 Codex 和浏览器,Anthropic 做 Claude Code 和 Claude in Chrome ,Google 把 Gemini 深度整合进 Search 、Chrome 、Workspace ,微软则拥有 Copilot 、GitHub 、VS Code 和 Office 。

    表面上看,这些公司是在丰富产品线,从用户那里赚钱。

    但对 AI 公司来说,产品还有另一层价值:

    产品是数据入口,是 Agent 的运行环境,是任务轨迹的收集器,是模型能力的验证场,也是下一代后训练数据的来源。

    浏览器尤其重要。

    因为浏览器几乎覆盖了用户的大部分数字行为:搜索、阅读、购物、写文档、使用 SaaS 、查资料、处理工作流。未来如果 Agent 真的能替人完成任务,那么浏览器就不只是一个客户端,而可能是 Agent 的操作系统。

    AI IDE 也是同理。

    IDE 不只是写代码的地方,而是软件生产过程的核心入口。谁掌握 IDE ,谁就更接近真实的软件工程轨迹。

    所以,顶级基模公司做 Codex 、Claude Code 、AI 浏览器,不一定只是为了卖更多订阅。更深层的原因可能是:它们必须拥有应用入口,否则长期会缺少最关键的真实任务数据。

    未来真正的竞争,可能是模型能力和应用入口之间的闭环。

    五、市场可能低估了工作流入口的价值

    最近市场对软件公司的担忧大致是:

    AI 会让软件越来越容易开发,软件开发成本下降,SaaS 产品更容易被复制,seat-based 收费模式受到挑战,所以软件公司的估值应该下降。

    这个逻辑有合理性。

    如果一家 SaaS 公司的价值主要来自“我写了一套别人暂时写不出来的软件”,那么 AI 的确会削弱它的护城河。

    但这只是第一层。

    还有第二层:

    AI 会降低写软件的成本,但不会自动降低获得真实用户、真实场景和真实工作流的难度。

    未来真正稀缺的,可能不是代码本身,而是用户每天如何完成真实任务的数据。

    如果一个产品只是功能集合,它可能被 AI commoditize 。

    但如果一个产品是高价值生产工作流的入口,它的价值可能反而会上升。

    GitHub 不是普通代码仓库,而是软件协作入口。VS Code 不是普通编辑器,而是开发者工作台。Office 不是普通办公软件,而是企业知识工作入口。Figma 不是普通设计工具,而是设计协作入口。浏览器也不是普通网页容器,而是数字世界的操作入口。

    这些产品在 AI 时代的价值,可能不只是收入,而是它们持续产生真实工作流数据的能力。

    六、为什么微软可能被市场重新认识
    微软最近股价大跌,但如果这个推论成立,微软是最值得重新审视的公司之一。

    微软拥有几乎所有关键资产:

    GitHub 、VS Code 、GitHub Copilot 、Azure 、Office 、企业客户、全球开发者生态、大量现金流和顶级工程团队。

    过去市场看微软 AI ,更多关注 Azure 增长、Copilot 收入和 OpenAI 合作。

    但如果从“工作流数据飞轮”的角度看,微软真正可怕的资产可能是 GitHub + VS Code + Copilot 。

    这三者组合在一起,几乎覆盖了软件生产的核心链路:需求、代码、提交、PR 、Review 、Issue 、CI/CD 、部署、Bug 修复和团队协作。

    Cursor 都能通过 AI IDE 和后训练能力训练出 Composer 2.5 ,已经让我们看到一个小型飞轮的可能性。那么拥有这些巨大资源的微软理论上可以拥有一个更大的飞轮。

    当然,前提是这些数据必须在用户授权、企业合同、隐私保护和法律合规的边界内使用。拥有入口不等于可以随便拿数据训练。

    但即便如此,微软拥有的工作流入口本身仍然极其稀缺。

    真正的问题不是微软有没有资源,而是微软能不能把这些资产组织成一个清晰的 AI 飞轮。

    七、微软过去为什么没体现出这个优势?

    一个合理的问题是:既然微软拥有这么多资产,为什么它没有更早做出 Composer 2.5 这样的产品?

    可能有几个原因。

    第一,微软过去太依赖 OpenAI 。过去几年,微软的 AI 叙事很大程度建立在 OpenAI 之上,它可以通过投资和云合作获得模型能力,所以没有那么强的动力自己把 coding model 后训练做到极致。

    第二,大公司组织复杂。GitHub 、VS Code 、Copilot 、Azure 、Office 分属不同产品线。资产很多,但要形成统一飞轮,需要很强的组织整合能力。

    第三,企业隐私和合规限制很强。微软服务大量企业客户,企业代码、私有仓库和商业数据都非常敏感。即使它拥有入口,也不能像小型创业公司那样快速试错。

    第四,市场过去关注的是商业化,而不是数据飞轮。投资者更容易理解 Copilot 收入、Azure 增长和 Office 提价,却未必会立刻理解“开发者工作流数据会成为下一代 coding model 的核心资产”。

    所以,微软的问题不是没有牌,而是它过去可能没有把这些牌组合成一个足够清晰的 AI 飞轮。

    八、这不是确定结论,而是一个投资假设

    这个推论很诱人,但不能把它当成确定事实。

    它有几个重要风险。

    第一,Composer 2.5 的成功可能主要来自合成数据、RL 方法和工程优化,而不是 Cursor 的真实用户数据。

    第二,真实用户数据未必能合法、合规地用于模型训练,尤其是企业代码和商业数据,限制会非常多。

    第三,微软拥有入口,不代表它有组织能力把入口转化为模型能力。

    第四,如果未来通用基模公司在没有垂直应用入口的情况下,也能持续训练出极强 coding model ,那么应用数据飞轮的重要性就会被削弱。

    第五,股价表现不仅取决于长期逻辑,也取决于买入时机、估值水平、利率、财报、市场情绪和竞争格局。

    所以,这不是“微软一定会涨”的结论,而是一个观察框架:

    如果 Cursor 持续证明 AI IDE 数据飞轮有效,如果 Fireworks AI 这类平台继续降低垂直模型训练门槛,如果 OpenAI 、Anthropic 继续强化应用入口,如果微软开始自研并推出强 coding model ,如果 GitHub 、VS Code 、Copilot 被整合成统一飞轮,那么市场可能会重新认识微软的 AI 价值。

    九、结论:软件公司的价值可能从“软件本身”转向“生产过程”

    AI 会让写软件变便宜,这几乎是确定的。

    但这不意味着所有软件公司都会失去价值。

    真正被削弱的,是那些只靠功能堆叠、缺少工作流入口的软件公司。真正可能变强的,是那些掌握高价值生产过程的软件公司。

    Cursor 的 Composer 2.5 之所以重要,是因为它让我们看到:一个 AI IDE 公司,不一定只是应用层公司。它也可能基于开源模型、托管训练平台和真实开发工作流,训练出更强的 coding model 。

    OpenAI 和 Anthropic 之所以要做 Codex 、Claude Code 、浏览器,也可能是因为它们意识到:没有应用入口,就很难拥有持续生成高质量任务轨迹的能力。

    而微软最特殊的地方在于,它早就拥有这些入口。

    GitHub 是代码协作入口,VS Code 是开发者工作台,Copilot 是 AI coding 的用户界面,Azure 是算力和企业基础设施,Office 是知识工作入口。

    如果微软能把这些资产真正组织成 AI 时代的数据飞轮,那么它不只是一个被 AI 冲击的传统软件公司,而可能是下一代软件工程模型的重要玩家。

    今天市场看到的是:

    AI 会降低软件开发成本,所以 SaaS 价值下降。

    但未来市场可能看到的是:

    AI 会提高真实工作流入口的价值,所以拥有这些入口的软件公司会被重新估值。

    Google 之前一度将要收购 Windsurf ,结果最后只收购了它的员工,我觉得这可能是一部败棋,让人不得不怀疑现在 Gemini 在 agent coding 领域的拉垮是不是因为缺少真实用户编程的工作流数据来 RL 导致的(特别是很多测评都说 Gemini 的世界知识不错,这说明它的基模肯定是不差的)。
    10 replies    2026-06-26 00:58:44 +08:00
    XTTX
        1
    XTTX  
       7h 45m ago
    哪个工作流是只有微软能做,其他 codex,claude code app 这种 AI agent 干不了的? google\mis 这种巨头干不过 A 也干不过 O ,连 Cursor 干不过。 公司花巨量精力在“安全”和“合规”上面,天然地劣势。
    defaw
        2
    defaw  
       7h 45m ago
    我看到了巨大风险,如果 openai 证明不了自己的稀缺性,只要靠后训练就能做出 gpt5.5 的话,纳斯达克就要完蛋了,懂王早就预料到这一步了吗,派马斯克去收购 cursor 然后干崩纳斯达克完成抄底和卸任。
    ryougifujino
        3
    ryougifujino  
    OP
       7h 33m ago
    @XTTX 没说只有微软能做,微软各方面都是 Cursor 的 pro max 版,只是认为它有这方面的潜力
    ryougifujino
        4
    ryougifujino  
    OP
       7h 31m ago
    @defaw 确实有这方面的风险,但 OpenAI 的目标应该是 Fable 5 ,这方面光靠后训练应该远远不够
    catazshadow
        5
    catazshadow  
       6h 19m ago
    TL;DR
    Julaoshi
        6
    Julaoshi  
       6h 5m ago
    copilot 中有了一个微软自己训练的模型“MAI-code-1-flash“,暂时没有试过。
    slackerman
        7
    slackerman  
       4h 42m ago via Android   ❤️ 1
    道理没错,AI 味有点重。说品味是人类的护城河还是有道理的,AI 的内容虽然结构化很强,但是容易抓不住重点,在无关紧要的地方啰嗦
    XTTX
        8
    XTTX  
       3h 41m ago
    @ryougifujino 大厂没有机会,一会他们都不真的懂 AI 和用户需要什么。
    我给你一个例子:Google gemini 生成一个他认为不符合规则的类似 nsfw 的图片, 它直接拒绝
    同样的 prompt, codex 会自动修改,打磨,直到生成成功。

    这里面两个厂有产品哲学上的不同。 微软即使有优势, 它也没有机会, 这是骨子里的问题
    ryougifujino
        9
    ryougifujino  
    OP
       3h 29m ago
    @slackerman 想法和思考是自己的,交给 GPT 写的,肯定有 AI 味,我也觉得有点啰嗦,还是精简过一次的🤣
    ryougifujino
        10
    ryougifujino  
    OP
       3h 27m ago
    @Julaoshi 后续看看这个模型能不能慢慢起来了。这个叙事能不能成立也要看 Cursor 能不能持续发布更强的模型。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   888 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 42ms · UTC 20:26 · PVG 04:26 · LAX 13:26 · JFK 16:26
    ♥ Do have faith in what you're doing.