我的使用姿势不对么, 我感觉 ds 很差劲啊, 比 grok3 差远了, 编程相关问题试了几次都表现很差

比如 example.nacos.com 这是我的 nacos 地址, 帮我写个 bash 脚本, 查询 cpp_long_link 命名空间下的所有服务信息, grok 可以一次写对, deepseek 就会忘记 pageSize 这个参数

Cloud9527

181 天前

最近再用 qwq-plus 感觉还可以,主要是吐字快!

evilStart

181 天前

deepseek 不行为什么美国人这么害怕？这么讨厌国产的还是 run 吧，在这里苦了你们了

kyor0

181 天前

只拿小红分滚出这个论坛

looplj

181 天前

llm 都不是很稳，不能因为单一场景，单次使用有点问题，就否定整个模型。。

Donaldo

181 天前

@ZSeptember #24 评论区完美体现了你这个观点，大家针对不同使用场景，分别对不同模型进行了赞扬和批判～

iamsad3508

181 天前

温度调到 0 ，再试

takanashisakura

181 天前

@zbw0414 #14 qwq-plus 也不用翻墙

9ki

181 天前

这个月高强度用 ai 学习，claude 3.7 （ Thinking ）/ R1/ Gemini(2.0, 2.5 今天刚开始用) 第一梯队，grok3 ，gpt-4.5 o1-mini 纯纯路边

我觉得讨论这种问题最好把你的 System Prompts 和 Prompts 放出来，像二楼那种 claude 都没用过，不知道哪来的自信参与讨论

Stunt4013

180 天前

@Donaldo 刚出的 gemini 2.5 pro 也很强

EricYuan1

180 天前

别的不说，手机 app ，这几个中 grok 做的最好看

qiaobeier

180 天前

通用的 deepseek （翻译，帮小孩写作文，润色文档，甚至还做过 WEB 项目配色方案等等，结果都很优秀）。写代码只使用 claude 。有买 GTP 但基本不用了。

lscho

180 天前

因为 ai 覆盖的场景太广泛，所以看测试就行。只有测试才能尽可能覆盖大部分场景。

单一场景谁都有可能出错

4eympe94CsqJ7Y39

180 天前

grok3 确实能打

k9982874

180 天前

先不说质量，输出速度 ds 是最慢的。。。

fancy2020

180 天前

百度和 Google 的区别

clino

180 天前

我其实是从 deepseek v2 开始用的，当时就感觉很好用，切成 v3 以后好像没有明显更好的感觉
当然我没怎么用过 claude 所以没有明显对比，但是 deepseek 一直给我感觉是相当好了

cookii

180 天前

体感 grok 确实很好用，比其他都强

zhwguest

180 天前

刚开始出来其实感觉很不错，但是后来慢慢觉得越来越不那么惊艳了...

LittleYangYang

180 天前

deepseek 我从 v2 开始用它去处理数据，当时主要是相比其他家太便宜了，效果还好，这价格很难让人拒绝()，就是并发非常低
新的 R1 主要强在它的强化学习策略，落在应用上它用的训练语料在写"抽象"文章这种 meme 上是非常强的，说的话非常似人，比其他模型更像贴吧老哥，但是编数据的幻觉倾向也很厉害，也有丢上下文的倾向，很多生成结果基本上义眼就能看出来是 deepseek 写的。
最近我在信息抽取工作上比较了几个模型，在我的 KG 任务上 ds 基本平均落后 qwen 系 5 个点左右，json 格式化约束的稳定度倒是还挺好。
其他的模型实际用起来其实感觉 grok3 幻觉也严重，gemini deepresearch 是真好用啊，谷歌的信息来源还是太猛，开了 gemini advanced ，下个月想把 gpt plus 关掉了，o3 真废物....

wweerrgtc

180 天前

@lzgshsj #13 思考 7 分钟也太慢了吧, 有没有问答链接可以看看呀

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1121273

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.