我的使用姿势不对么, 我感觉 ds 很差劲啊, 比 grok3 差远了, 编程相关问题试了几次都表现很差

181 天前
 jdz

比如 example.nacos.com 这是我的 nacos 地址, 帮我写个 bash 脚本, 查询 cpp_long_link 命名空间下的所有服务信息, grok 可以一次写对, deepseek 就会忘记 pageSize 这个参数

18419 次点击
所在节点    程序员
164 条回复
Cloud9527
181 天前
最近再用 qwq-plus 感觉还可以,主要是吐字快!
evilStart
181 天前
deepseek 不行为什么美国人这么害怕?这么讨厌国产的还是 run 吧,在这里苦了你们了
kyor0
181 天前
只拿小红分滚出这个论坛
looplj
181 天前
llm 都不是很稳,不能因为单一场景,单次使用有点问题,就否定整个模型。。
Donaldo
181 天前
@ZSeptember #24 评论区完美体现了你这个观点,大家针对不同使用场景,分别对不同模型进行了赞扬和批判~
iamsad3508
181 天前
温度调到 0 ,再试
takanashisakura
181 天前
@zbw0414 #14 qwq-plus 也不用翻墙
9ki
181 天前
这个月高强度用 ai 学习,claude 3.7 ( Thinking )/ R1/ Gemini(2.0, 2.5 今天刚开始用) 第一梯队,grok3 ,gpt-4.5 o1-mini 纯纯路边

我觉得讨论这种问题最好把你的 System Prompts 和 Prompts 放出来,像二楼那种 claude 都没用过,不知道哪来的自信参与讨论
Stunt4013
180 天前
@Donaldo 刚出的 gemini 2.5 pro 也很强
EricYuan1
180 天前
别的不说,手机 app ,这几个中 grok 做的最好看
qiaobeier
180 天前
通用的 deepseek (翻译,帮小孩写作文,润色文档,甚至还做过 WEB 项目配色方案等等,结果都很优秀)。 写代码只使用 claude 。有买 GTP 但基本不用了。
lscho
180 天前
因为 ai 覆盖的场景太广泛,所以看测试就行。只有测试才能尽可能覆盖大部分场景。

单一场景谁都有可能出错
4eympe94CsqJ7Y39
180 天前
grok3 确实能打
k9982874
180 天前
先不说质量,输出速度 ds 是最慢的。。。
fancy2020
180 天前
百度和 Google 的区别
clino
180 天前
我其实是从 deepseek v2 开始用的,当时就感觉很好用,切成 v3 以后好像没有明显更好的感觉
当然我没怎么用过 claude 所以没有明显对比,但是 deepseek 一直给我感觉是相当好了
cookii
180 天前
体感 grok 确实很好用,比其他都强
zhwguest
180 天前
刚开始出来其实感觉很不错,但是后来慢慢觉得越来越不那么惊艳了...
LittleYangYang
180 天前
deepseek 我从 v2 开始用它去处理数据,当时主要是相比其他家太便宜了,效果还好,这价格很难让人拒绝(),就是并发非常低
新的 R1 主要强在它的强化学习策略,落在应用上它用的训练语料在写"抽象"文章这种 meme 上是非常强的,说的话非常似人,比其他模型更像贴吧老哥,但是编数据的幻觉倾向也很厉害,也有丢上下文的倾向,很多生成结果基本上义眼就能看出来是 deepseek 写的。
最近我在信息抽取工作上比较了几个模型,在我的 KG 任务上 ds 基本平均落后 qwen 系 5 个点左右,json 格式化约束的稳定度倒是还挺好。
其他的模型实际用起来其实感觉 grok3 幻觉也严重,gemini deepresearch 是真好用啊,谷歌的信息来源还是太猛,开了 gemini advanced ,下个月想把 gpt plus 关掉了,o3 真废物....
wweerrgtc
180 天前
@lzgshsj #13 思考 7 分钟也太慢了吧, 有没有问答链接可以看看呀

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1121273

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX