最近这段时间,我一直在做 Agent Runtime 。
然后越做越发现一个问题。
现在很多 Agent Demo ,看起来真的很猛。
会规划。 会调用 Tool 。 会 MCP 。 会 Multi-Agent 。 还能自己拆任务。
但问题是。
这些东西很多时候只适合 Demo 。
一旦真的开始接企业里的系统,问题马上就开始出现。
比如:
一个长任务执行 20 分钟之后,上下文乱了怎么办?
多个 Agent 同时修改状态,memory 冲突怎么办?
AI 调错 Tool 了怎么办?
任务执行到一半挂了,怎么恢复?
企业里的权限怎么隔离?
出了问题之后,怎么审计?
这些问题其实都不是 Prompt 能解决的。
甚至很多都已经不是“大模型问题”。
而是 Runtime 问题。
我现在越来越觉得,现在很多人其实高估了 Agent 的“智能”,但低估了 Agent 真正进入生产环境的难度。
因为 AI 一旦开始真正“做事”,而不是聊天,它碰到的问题会越来越像:
- 分布式系统
- 状态机
- 调度系统
- 工作流引擎
- 权限系统
而不是 Prompt Engineering 。
所以我最近在做的东西,核心已经不是“怎么让 Agent 更聪明”。
反而是:
怎么让 Agent 不失控。
现在我的思路有点像:
Runtime 负责管理。
Agent 负责干活。
用户请求进来之后,Runtime 先做路由,再把任务交给不同领域的“数字员工”。
每个员工只负责自己领域内的事情。
然后 Runtime 去解决:
- 权限
- memory
- 调度
- sandbox
- 状态恢复
- 多 Agent 协同
- Human-in-the-loop
这些问题。
我现在甚至有一种感觉。
未来企业真正需要的,可能根本不是一个“超级 Agent”。
而是一套稳定的数字员工系统。
而真正难的部分,也不是模型。
而是 Runtime 。