Agent 时代的软件接口

5 小时 26 分钟前
 bmpidev2019

最近写了一篇文章,整理我这段时间做 MyInvestPilot 和 MinePilot / CraftDAG 时反复遇到的一个架构问题:AI Agent 时代的软件,不能只考虑 Human-friendly UI ,也要开始考虑 Agent-friendly workflow 。

文章里我用两个完全不同的领域做案例:

一个是量化投资系统,如何避免大模型直接写带有前视偏差的交易代码; 一个是 Minecraft 建造引擎,如何避免大模型直接生成低层方块坐标。

最后它们都收敛到同一套模式:

自然语言意图 → 领域 DSL → IR / DAG → 机器可读验证 → 修复循环 → 确定性执行

我的理解是:未来很多复杂系统,不是简单加一个聊天框就够了,而是需要把领域知识重塑成 Agent 能稳定操作的 workflow surface 。

文章在这里: https://www.bmpi.dev/dev/agent-native-system-paradigm/

948 次点击
所在节点    分享创造
4 条回复
cpstar
4 小时 52 分钟前
我的判断是这样的:
远古时代,打孔纸带,这是为了给机器可读,人退而求其次,于是对人的要求非常非常高
上古时代,汇编等机器语言,还是为了给机器,但是人要一定程度上可操作,降低了人机交互难度
中古时代,开始有人机交互界面,命令行形式,键盘飞起
近古时代,命令行还是不人性,图形界面发明,鼠标飞起
近代,鼠标键盘还是不爽,开始触摸屏,指哪打哪

同时,在一些应用级软件上,虽然经历了 C/S 、B/S 等阶段,但总归都是为了给人更好的操作,让人肉眼识别然后决策然后操作。

说到底,以上都是人机的交互,UI 也好 UX 也好,目标是人。但是到了当代,AI 化,人好像在中间没啥用。机器与机器的沟通,原则上不需要向“人”兼容——你们(机器们)聊去吧,关我(人)啥事——然后各种 mcp 、skill 偏向于回归 cli 方式,实际上在往中古回归。那么有没有可能往上古回归,再说吧。
GeruzoniAnsasu
4 小时 48 分钟前
@cpstar 其实没说到 OP 想讲的点子上。OP 的项目跟我在做的有一定相似性 —— 对于 agent 来说,它的思考是外化的,所以功能逻辑也必须外化以便让 AI 能顺着你的逻辑去思考。这就要求你用类似 DAG 的方式组织逻辑节点,与人类思维「黑箱+交流 diff ,逻辑内藏」的方式完全不同。
vopin
4 小时 23 分钟前
最难的点是不是编译器?
dacapoday
3 小时 39 分钟前
DSL 这点前年开始就有很多人想到,并在相关 agent 项目中进行实验。
DSL 的定义,特别是 Agent 自行演化并迭代更新 DSL ,有更多潜力。
而这会引出程序背后更本质的概念:状态转移矩阵(行列是前后状态,单元格是转移事件)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1220432

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX