今天 Claude Opus 4.8 发布了,又一次升级,说现在已经支持在一次会话里调度几百个子 agent 同时干活了。
虽然听起来又是一个新的 token 绞肉机,但是。。。利好一人公司!哈哈。
但是我在评论区下面刷到了一个瓜,说 4.8 蒸馏了太多 qwen 等开源模型,导致自我认知出了问题,你现在问它是谁,它基本认为自己是千问,哈哈。
不过它吹任它吹,别把 4.6 下了就行,我看他们说非编程感受还不如 4.6 ,不如等之后传说中更聪明的 Mythos 吧。
今天 Claude Opus 4.8 发布了,又一次升级,说现在已经支持在一次会话里调度几百个子 agent 同时干活了。
虽然听起来又是一个新的 token 绞肉机,但是。。。利好一人公司!哈哈。
但是我在评论区下面刷到了一个瓜,说 4.8 蒸馏了太多 qwen 等开源模型,导致自我认知出了问题,你现在问它是谁,它基本认为自己是千问,哈哈。
不过它吹任它吹,别把 4.6 下了就行,我看他们说非编程感受还不如 4.6 ,不如等之后传说中更聪明的 Mythos 吧。
1
kpprotector 6h 44m ago 说句实话,大家都在偷偷蒸,属于是公开的秘密了。
但是,Anthropic 出现这个问题的时候就稍显讽刺了,尤其是前面发的几篇博客…… |
2
lujiaosama 6h 42m ago
互相蒸馏,不会导致模型劣化吗
|
3
GeorgeV 6h 41m ago @kpprotector 并不讽刺。Anthropic 说国产几个模型蒸馏它家的危害美国国家安全,但它反过来蒸馏肯定是增强美国模型能力,逻辑是一致的,都是为了美国好。
|
5
lmmlwen 6h 33m ago
Opus 蒸馏 qwen 真没绷住
|
6
nc 6h 32m ago
有可能是购买了国内中转站用户对话数据做训练导致的,并不是直接蒸馏模型
|
8
mMartin 6h 21m ago 这页面都不是官方的页面 不定什么野鸡中转站
|
9
cheng6563 6h 19m ago
这种从 GPT4 时代就开始的月经贴还要发几年。
|
11
kpprotector 6h 1m ago
|
12
kpprotector 5h 59m ago
@Nzelites 知识蒸馏的话问题(上下文)是针对性设计过的吧。
直接买语料则什么数据都有。 |
13
GeorgeV 5h 52m ago @kpprotector 有逻辑的,Anthropic 的观点就是民主的 AI 模型要胜过非民主的 AI 模型,它是在维护人类文明
|
15
cmos 4h 27m ago
Dario:两个凡是!凡是美国作出的产品,都是伟光正,我们要坚决坚决维护;凡是中国的背景,都是邪恶的,我们都始终不渝地反对。
|
16
nc 4h 22m ago
@kpprotector 不知道 Anthropic 从哪搞的数据,大概率就是用简中对话数据做 RL 后训练导致的。这个在业界是常规操作了,Cursor 的 Composer 就是基于 Kimi 然后用对话数据做 RL 。
不过能看出来 Anthropic 对中文是有重视的 |
17
dsd2077 PRO 你这话一说,档次一下就掉下去了。哈哈哈
|
18
kneo 4h 14m ago via Android
反正我不知道蒸馏 qwen 他图啥。
|
20
chenluo0429 4h 11m ago via Android
什么蒸馏不蒸馏的?明明是在训练中使用了精心挑选的高质量合成数据,不懂不要乱说好伐?
|
21
dabbit 4h 2m ago
2026 年了还有人问 LLM 它是什么模型...
|
22
nan7 3h 57m ago
claude 是好模型,但是他的公司很傻逼,希望早点被收购吧
|
23
shyrock2026 3h 56m ago
@dabbit #21 都是中转站最忠实的一批用户。。。
|
24
409164 3h 54m ago 赢学总能找到地方切入
|
25
106npo 3h 54m ago
你怎么知道这不是针对简中的反蒸馏措施呢 狗头
|
26
Rickkkkkkk 3h 15m ago
你无法通过问 ai 得知 ai 是什么模型的(除非专门针对这个问题定制过回答
会回答成别的模型是典型的模型幻觉 |
27
jony83 2h 45m ago
图就是 qwen 生成的吧
|
28
L4Linux 2h 38m ago
|
29
yunCrush 2h 36m ago
真以为其他人买不起正版的 claude 吗? 20:17Claude responded: 我是 Claude Opus 4.我是 Claude Opus 4.8,由 Anthropic 开发,目前是公开可用的最先进的模型。有什么可以帮你的吗?
|
30
L4Linux 2h 33m ago
|
31
gpt5 2h 31m ago via iPhone
opus 只是从千问这里拿回来以前千问从 opus 偷走的东西,这叫正当防卫🤝 虽远必诛,虽迟但到🤝
|
32
renzhe8102 2h 26m ago 5 月 10 日问的, 回答是 5 月 29 日?
|
33
zictos 2h 26m ago
我大概一两个月前用 claude 的官方 api 试过 haiku 模型,问它模型的版本号,遇到过一次它回复说是 deepseek 。
不过现在再试的话又无法复现了,现在用 haiku 模型问它模型版本号,它回复说“我是 Claude 3.5 Sonnet”。 用更好的模型进行测试的话没遇到这样的问题。 |
34
GeminiPro 2h 13m ago
每次新模型发布都有一堆吹的,但实际总归不如前面几代。
|
35
cairnechen 28 mins ago
问 DeepSeek 它说自己是 Claude ,这个是邪恶的蒸馏,问 Claude 它说自己是 Qwen ,这个正常的语料训练,大家一定要分清
2026 年了还有人问 LLM 它是什么模型... 确实傻得冒泡,但是等国产模型不被这么干并且口口声声“铁证如山”的时候,再来对这种月经贴义愤填膺吧 |