ds 的 V3 和 R1 哪个好用?

housex

208 天前

DeepSeek-V3
通用型模型：专注于自然语言处理、知识问答、内容创作等通用任务，目标是实现高性能与低成本的平衡，适用于智能客服、个性化推荐系统等场景。
训练重点：通过算法优化降低训练成本，采用多令牌预测（ MTP ）和无辅助损失负载均衡策略提升效率，支持 128K 上下文窗口。
DeepSeek-R1
推理专用模型：专为数学、代码生成和复杂逻辑推理任务设计，通过大规模强化学习（ RL ）提升推理能力，对标 OpenAI o1 系列。
创新训练方法：完全摒弃监督微调（ SFT ），采用纯强化学
习（如 GRPO 算法）训练基座模型，并通过冷启动数据优化可读性。
具体可以看下这篇： https://zhuanlan.zhihu.com/p/20240802247

FireKey

208 天前

文科 V3 好,理科 R1 强

DOOMS

208 天前

DeepSeek-V3 专注于自然语言处理、知识问答、内容创作等通用任务
DeepSeek-R1 推理专用模型，专为数学、代码生成和复杂逻辑推理任务设计

大概是这种区分吧

hafuhafu

208 天前

就结果而言肯定是 R1 强。
但是肯定不是啥问题都丢 R1 问，太浪费时间了，简单问题也没啥必要。
我反正是日常丢 V3 ，结果不满意/复杂问题再丢 R1 。其他厂商的模型同理。

Tink

208 天前

V3 写文章好，R1 推理好

IvanLi127

207 天前

R1 很适合我这种话都说不清楚的人，他能硬生生地理解我的意思，能让我少打很多字。
我一般容易说清楚的小问题找 v3 ，难描述的问题找 r1 。

Sting1226

207 天前

R1 ，它会尝试去「理解」你的问题。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1114518

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.