内容简单的说,首先模仿 jetbrains 的 compose dsl 实现一套 kotlin 的声明式 UI ,然后写 html 解析器,把 html+css+js 翻译成这个 compose dsl ,js 状态和 kotlin 里的双向绑定,然后渲染引擎本身桥接到 minecraft 的 drawcontext 上去完成 2d 渲染。
把 effort 开到 max 之后,每个小时大概消耗 10M tokens ,干活挺慢,大部分时间在推理,对话轮数显著降低了,这对于模型提供商来说是最不利的场景,模型提供商最喜欢的场景是快速的触发多轮对话,每一轮对话都要把前一轮所有历史收一次缓存读的钱,但是 glm5.2 在把推理强度开满之后,大量的时间在 decode ,这样其实质谱赚不到什么钱,因此或许有过一两个星期之后推理强度暗改可能。