ds 的 V3 和 R1 哪个好用?

208 天前
 crocoBaby

总感觉 R1 很罗嗦,是不是需要科研级别的问题才会用到 R1?但是 V3 老是提示服务繁忙..

2236 次点击
所在节点    问与答
8 条回复
Mjhhh
208 天前
我让它写代码,R1 给出的代码质量会更高
housex
208 天前
DeepSeek-V3
通用型模型:专注于自然语言处理、知识问答、内容创作等通用任务,目标是实现高性能与低成本的平衡,适用于智能客服、个性化推荐系统等场景。
训练重点:通过算法优化降低训练成本,采用多令牌预测( MTP )和无辅助损失负载均衡策略提升效率,支持 128K 上下文窗口。
DeepSeek-R1
推理专用模型:专为数学、代码生成和复杂逻辑推理任务设计,通过大规模强化学习( RL )提升推理能力,对标 OpenAI o1 系列。
创新训练方法:完全摒弃监督微调( SFT ),采用纯强化学
习(如 GRPO 算法)训练基座模型,并通过冷启动数据优化可读性。
具体可以看下这篇: https://zhuanlan.zhihu.com/p/20240802247
FireKey
208 天前
文科 V3 好,理科 R1 强
DOOMS
208 天前
DeepSeek-V3 专注于自然语言处理、知识问答、内容创作等通用任务
DeepSeek-R1 推理专用模型,专为数学、代码生成和复杂逻辑推理任务设计

大概是这种区分吧
hafuhafu
208 天前
就结果而言肯定是 R1 强。
但是肯定不是啥问题都丢 R1 问,太浪费时间了,简单问题也没啥必要。
我反正是日常丢 V3 ,结果不满意/复杂问题再丢 R1 。其他厂商的模型同理。
Tink
208 天前
V3 写文章好,R1 推理好
IvanLi127
207 天前
R1 很适合我这种话都说不清楚的人,他能硬生生地理解我的意思,能让我少打很多字。
我一般容易说清楚的小问题找 v3 ,难描述的问题找 r1 。
Sting1226
207 天前
R1 ,它会尝试去「理解」你的问题。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1114518

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX