AI 到底有没有看懂你的提示词?

2 小时 32 分钟前
 luckybilly

你有没有过这种经历?

想用 AI 做点什么(比如写代码),认真地梳理完思路、写完一段提示词,发送之后只能干等。少则几十秒,多则几分钟。你不知道 AI 怎么拆解你的需求,不知道它悄悄脑补了什么前提、曲解了哪些约束。只能等它全部输出完,回头一看:坏了,跑偏了。

前面等的那些时间全部白费。你要么清空上下文从头来,要么在多轮对话里一点点掰正它,每轮对话都是分钟级的等待。大量时间耗在纠错上,而不是做正事。思路也被打乱了,心态也崩了。

吃过亏之后,你开始事无巨细地把边界条件、隐含逻辑全塞进提示词,试图堵死模型乱猜的空间。但写提示词的成本陡增,而且你还是没法提前知道它到底理解对了没有。问题没解决,只是换了个形式。

Andrej Karpathy 也吐槽过

模型代表你做出错误假设,然后就径直跑下去而不检查。它们也不会管理自己的困惑,不会寻求澄清,不会显示不一致之处,不会呈现权衡,不会适时反推,而且它们还是有点太谄媚了。

现在行业里流行 SDD ( Spec-Driven Development ,规格驱动开发),提前写 Spec 文档明确需求边界,能减少歧义。但这套流程有个盲区:没法提前确认 AI 是不是真的读懂了,理解偏差还是要等 AI 执行完之后才暴露出来,有些甚至还需要靠你自己去检查才能发现。

怎么办?

开源项目 luckybilly/understand-first 就是解决这个问题的:

强制 AI 在执行任务之前,先完整输出它对提示词的理解。不用等漫长的生成结束,你马上就能看到它接下来要做什么,有没有曲解你的意思、有没有擅自加戏。发现偏差立刻纠正,不用事后返工。

效果是这样的:

欢迎试用,觉得不错的话 star 🌟 支持一下哦~

开源地址:https://github.com/luckybilly/understand-first

支持 ClaudeCode 、Codex 、Cursor 、KimiCode 、WorkBuddy... 等国内外各种 Agent (把链接贴给你的 Agent 让 AI 自己给你安装即可).

502 次点击
所在节点    推广
8 条回复
TimePPT
2 小时 20 分钟前
@Livid 推广
lichdkimba
1 小时 56 分钟前
这和 plan mode 相比有什么优势?
bush911
1 小时 48 分钟前
看不懂它就不是好 AI
8888888888
1 小时 41 分钟前
这不是套娃吗
nicaiwss
1 小时 36 分钟前
这种简单的功能一般官方都有实现,比如 plan 模式
luckybilly
1 小时 18 分钟前
@lichdkimba 可以看作是轻量版的 plan 模式,但 plan 模式我们一般是在有较大的工作要做之前才进入 plan 来制定计划。 这个库是每次都让 AI 将它的理解展示出来,我们平时写的提示词一般没有那么严谨,AI 容易理解不完整。
skuuhui
50 分钟前
首先,transformer 大模型没有懂不懂的概念,即便他完整输出了对提示词的理解,他做的时候也不一定按照前面自己说的话的去做并且能带来注意力上的问题。
其次,你不要把它拟人,而是要把你自己的语言拟 AI 。不转变这样的思想,其他的所有东西都是画蛇添足。
再者,你的这个场景,我个人常用的解决方案是先和 seesion1 (这一步不考研模型编码能力,考验的是知识库,项目记忆,代码阅读,连网搜索的能力)进行共创(你一言我一语),知道我觉得设计的差不多了,让他形成文档。开个 session2 ,让他按照文档去 coding 。但这个本质上解决的不是它所谓的“理不理解你“的问题,而是你知不知道你想干什么的问题。
r6cb
9 分钟前
你这和让 ai 先写一份 spec 有区别吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1223918

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX