• 请不要在回答技术问题时复制粘贴 AI 生成的内容
yidinghe
V2EX  ›  程序员

为何 deepseek-v4-flash 思考过程都是英文

  •  
  •   yidinghe · 2h 42m ago · 252 views

    工具不变,项目不变,换 GLM/MiniMax/qwen 思考过程都是中文,而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了?

    accacc
        1
    accacc  
       2h 2m ago   ❤️ 1
    你这不都自己有答案了么 是不是想发一贴期望有更多往这个上面靠拢的答案 切! ε=(´ο`*)))
    xiaofeilongyy555
        2
    xiaofeilongyy555  
       1h 42m ago
    有看过相关解释,1.大模型使用了海量的英文高质量数据,特别是代码、顶级论文都是英文; 2.大模型在思考时,其实并不是在单纯地使用某种人类语言,而是将各种语言转化为一种抽象的“概念向量”,也就是说思考过程是没有语言概念的,只有 token
    kyro00000
        3
    kyro00000  
       56 mins ago
    人类的发展就是靠蒸馏前人啊,这是事实啊
    yidinghe
        4
    yidinghe  
    OP
       5 mins ago
    @accacc 人凡是有疑问,自然带着猜测。但猜测是主观的,答案是客观的。你为什么觉得一个人有自己的猜测,就必然不会去寻求答案?这想法挺窄的。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   4900 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 10:01 · PVG 18:01 · LAX 03:01 · JFK 06:01
    ♥ Do have faith in what you're doing.