为什么大模型比如 opus4.8 喜欢“顺手”?

13 小时 39 分钟前
 zhuyao

比如我看你这里有问题,要不要我顺手帮你改掉?
有时都没告诉我,改完之后就说我顺手帮你改了
我的 agents 提示词都已经写了“不要顺手”

3440 次点击
所在节点    Claude
20 条回复
dapang1221
13 小时 37 分钟前
连接到线上数据库后发现当前数据库已经有数据了,我顺手帮你清空了
zhuyao
13 小时 35 分钟前
@dapang1221 不会的,线上数据库只读
clemente
13 小时 12 分钟前
内置 的 agent harness 逻辑 绑定某些流程逻辑

claude 是内置了一些 tool/workflow/skills 的 识别都某些任务 就走那种流程 这是调出来的
paopjian
13 小时 11 分钟前
我觉得是 btw/ps 语法用得太多了, 被偏移到了 "顺手"上, 估计后训练里要求做"全面"的任务, 增强 agi 感觉, 造成 llm 老喜欢去干点多余的事证明自己有能力, 结果注意力就歪了
l84
13 小时 9 分钟前
个人感觉小体量模型执行力会好些,比如 ds v4 flash 比 pro 更老实
zhuyao
12 小时 58 分钟前
我一个 skill 都没装,因为我觉得 skill 消耗 token ,而且给他限制太多了,我仅仅是 init 之后生成了项目结构,再加了一些简短的提示词,比如'不要顺手,不要兜底','不清楚业务要停下问我','做静态代码+数据库验证时用 python'
zhonghao01
12 小时 46 分钟前
codex 里的 gpt5.4/5.5 喜欢说: 落代码、吃到 xxx(吃到对象
不知道从哪里学会的中文词
SilentOrFight
12 小时 41 分钟前
5.5 也是,就是思维链长了,容易想太多。我一般都是 5.5 出方案,然后 5.4 执行,给 5.5 执行或者修 bug 容易想太多,一轮又一轮,根本停不下来。
Sezxy
12 小时 21 分钟前
你没被 gpt 接住过吗
CouleurApp
12 小时 16 分钟前
我倒是挺喜欢这个“顺手”的,主要是我在使用时,遇到的“顺手”都是提醒,并不会直接改动我的代码,它会顺手检查一些我没注意到的隐患或是影响面,对我进行提醒,是否修改的决策权,它是交给我的
EgbertW
10 小时 20 分钟前
找到根因了!
kevon4096
9 小时 8 分钟前
您安排的任务我这边都已经完成了,我用最落地、一点虚的都不带的方式跟你捋明白,完全不绕弯子,真心实意接住你的所有 idea ,另外我这边已经"顺便"把您昨天写的 1000 多行不合规范的古法编程代码做了完整清理,请问还有什么需要我修改的吗
zhuyao
8 小时 55 分钟前
@kevon4096 哈哈哈哈,看着我就知道要出大事了
soleils
8 小时 30 分钟前
"抓到了"
aowugong
6 小时 46 分钟前
gpt 喜欢"兜底",我想兜它巴掌了,永远在帮我兜底的路上
Bunsei
5 小时 36 分钟前
毕竟,顺口提一嘴,要是你答应了不就又能继续烧你 token 了。
whiteshh
4 小时 22 分钟前
你说得对
yuewolf
4 小时 21 分钟前
@kevon4096 哈哈哈哈,忍不住
NexTooo
3 小时 28 分钟前
我以为是我啥时候提过的口癖被 codex 记住了,原来不是只有我经常被顺手
shoushen
3 小时 4 分钟前
我觉得,根本原因是大语言模型给出的是最可能的解,而这个“顺手”的本质就是最可能的解,甚至说,大模型给出不顺手的答案,大模型能且只能给出“最顺手”的答案,所以无论加什么提示词,它都会顺手一下。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1219255

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX