r1mix: R1 思维链让普通 AI 更聪明

157 天前
 faceair

经常体验不同大模型的朋友都知道,deepseek r1 的思维链质量非常高,脑子非常聪明并且情商高,但在实际使用的时候:

  1. 指令遵循的能力较差,不能完全按照要求输出
  2. 写作辞藻非常华丽和刻意,写出的文字总能一眼 R1,阅读体验和沉浸感感都比较差

其他的普通模型,在指令遵循和写作文风上都有更优异的表现,但是脑子又弱一点。

根据 aider 做的模型评测 deepseek-r1 的思维链 + claude 3.5 模型的执行力 就可以达到 SOTA 级别的效果,而价格比 claude-3-7-sonnet-20250219:thinking 便宜更多。

我们最近实测 deepseek-r1+deepseek/deepseek-chat-v3-0324 的混合模型在写代码上也有非常优异的表现。

最近我们做了一个 r1mix 的模型混合的网站,可以让你用 deepseek-r1 去加持任意的模型,不管是在写代码、写作其他各自通用任务上都有绝佳的表现。

常见的推荐组合是:

  1. r1v3:新版 DeepSeek-V3 显著增强了代码能力和文学创作能力,在加持 DeepSeek-R1 后可以在最优的价格下实现 SOTA 级性能。
  2. r1claude:Claude 系列模型的代码能力是当前的 No. 1 ,在加持 DeepSeek-R1 后可以以更优的价格达到 Claude 3.7 Sonnet Thinking 的效果。
  3. r1grok:Grok-3 的文学创作能力是 Top 级别的,在加持 DeepSeek-R1 后故事的剧情会更加合理,表达也更富有层次感。
  4. r1gemini:Gemini 2.0 系列知识面非常广泛、能力也很全面,在加持 DeepSeek-R1 后可以轻松应对各种复杂需求。

常见的模型都有,可以根据需求自己任意组合。也可以绑定你的 openrouter 账号,使用 openrouter 上的免费模型的时候我们不收费。

https://r1mix.ai

6175 次点击
所在节点    分享创造
19 条回复
maximdx
157 天前
有意思,这种多个模型搭配使用的原理是什么?
faceair
157 天前
@maximdx #1 先调用思考模型,获取到思维链以后停止请求,把思维链拼到原始请求里请求第二个模型
DigitaIOcean
157 天前
有趣,关注
xyfan
157 天前
LLM 的客户端 chatwise 好像也增加了类似的功能,调用一个模型的 thinking ,并应用于另一个模型
listenfree
157 天前
按你这样说,qwq32B+qwen2.5code 也是 SOTA 级别哟,就是不知道如何流程化试用
faceair
157 天前
@listenfree #5 我们暂时没有 qwen2.5 code 模型的供应,你可以绑定你的 openrouter 账号,然后两个模型名用加号连接就可以调用了
iyaozhen
157 天前
我充值试了下,感觉还行。不过也没解决 R1 本身的幻觉问题,就是 R1 强是强,但是不太稳定
ovtfkw
157 天前
@faceair #2 就这?岂不是很简单
pakro888
157 天前
市场上早已经有人开发出来了:
1. https://github.com/ErlichLiu/DeepClaude(支持模型自由组合)
2. https://github.com/getasterisk/deepclaude (上方项目的灵感来源)
rqYzyAced2NbD8fw
156 天前
@xyfan #4 chatwise 能火纯粹是 openwebui 的作者太傻逼。Deepseek 都出来多久了还以 ‘OAI 没有 API 实现’ 为理由拒绝显示思考过程的 PR 。核心功能不做,莫名其妙的垃圾功能做一堆,还自我感觉良好。要不是因为我也是个傻逼我真想 Fork 一个自己开发
SkywalkerJi
156 天前
主楼说的模型特点是中文写作吗,还是说外文也一样。
Lee90
156 天前
邮箱登录好评
paopjian
156 天前
赛博换脑, r1 的思维脑接上 claude 的嘴
Seayon
156 天前
Cline 在写代码的时候也是先 PLAN 后 ACT ,我现在都用 deepseek-r1 去 思考计划,然后切换到 claude 再去 ACT
anjingdexiaocai
156 天前
这就是 deepClaude 吧,很早就有了
hugowangnz
156 天前
@LanhuaMa 太对了,这么流行的功能不做,目前只能自己写函数支持思维链显示了
LinSP
156 天前
这不是变形版蒸馏
flcwk
155 天前
@faceair 对的,相当于用思考模型做规划,然后让实践能力强的模型进行操作,之前的 deepclaude 和 deepgemini 都是这个思路,进一步的可以引入多个思考模型进行专家会审,效果更佳
faceair
155 天前
@flcwk #18 多思考模型的话算是 agent 的思路了,做 API 的话延迟太大了 token 数跟效果也成正比的话,用户不买账

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1122292

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX