claude-opus-4-6 大家实际使用感觉怎么样?

1 天前
 Ulduar

claude-opus-4-6 目前在大模型编程这方面看上去排名第一了 想问问大家的体验

988 次点击
所在节点    编程
8 条回复
paidaxtis
1 天前
实话说,我在 sonnet 4.5 后,通常的工作问题用 claude code 基本上都能解决了。后续也是跟着最新的模型走,过了能完成常见代码问题的甜蜜点后,都体感不出差异。
不过最难的问题,还是直接 codex ,用 5.2 或 5.3-codex 的 high/xhigh
stinkytofux
1 天前
周末登了两天的福利中转站, 4.6 非常好用, plan 聊清楚的任务, 几乎不会出错, 代码一次编译成功. 不像其他模型丢三落四的.
hanguofu
23 小时 30 分钟前
@stinkytofux 求推荐福利中转站,谢谢!
letitbesqzr
23 小时 10 分钟前
感觉和 opus 4.5 差不了多少 , 4.5 已经能实现我绝大部分需求了... 贵还是最大的问题

最近几天 5.3-codex 用的比较多, 量大管饱 , 价格实惠.
stinkytofux
22 小时 56 分钟前
@hanguofu V 站不是天天有人发么
stinkytofux
22 小时 55 分钟前
@letitbesqzr 朋友, 5.3-codex 怎么买的? 指个路
gadfly3173
22 小时 54 分钟前
感觉比 4.5 聪明一点,速度快一点
a632079
17 小时 39 分钟前
指令遵从性比 opus 4.5 差很多。
经常定义了多个 Phrase ,比如说 Phrase 2 调用 Codex ,Gemini 进行多模型分析需求,会被主动跳过。
再比如生成代码原型,后端使用 codex 生成指令会高很多,opus 4.6 往往选择这时候跳过。
最重要的是实施完成后,需要进行代码指令控制,使用多模型审核,以及单元测试,一不注意 opus 4.6 就跳过了。
Opus 4.5 在使用相同的 skills 和 prompt 都没有这样的问题。

以及在调试错误,opus 4.6 会陷入死循环。比如说测试失败,需要更新一下 snapshot ,尝试方案 A->B->C->A 会循环重试。
* 而 Codex 5.3 在尝试 2-3 cycle 后就解决了
* Opus 4.5 虽然不能解决,但是也能告知可能路径,不会循环重试

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1191627

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX