meta 搞了很久搞出了 llama4, 为啥小米可以这么快搞定 mimo

1 天前
 summerLast

国内人才储备量大? deepseek 改变了时间线,有作业抄?

1731 次点击
所在节点    问与答
13 条回复
beimenjun
1 天前
v2-pro 是 3/11 ,v2.5 是 4/22 ,算下来,考虑一下假期,差不多这个月 20 号,应该可以见到 mimo-v2.7 吧。
murmur
1 天前
好像就是从 deepseek 挖的人,罗原来就是 deepseek 团队的
Yanickkk
1 天前
Deepseek 的存在,GLM5.1 的结构和 DeepSeek 几乎一样,只是在预训练和后训练上投入多点就可以获得不差的效果。架构带来的优势现在被拉平的不少,meta 的时代开源还没摸索出一个优秀的结构呢
dingawm
1 天前
meta 感觉主要还是之前组织比较混乱,调整后现在不是也有 muse spark 了,不过好像一般用户使用的还是比较少,也没啥声音说能力怎么样。
lscho
1 天前
因为 deepseek 每次开源之后写的技术报告太详细了,按照他的技术路线可以完全复现
xuhengjs
1 天前
所以粱圣伟大啊,这么好的东西就开源了。再加上蔡福莉也是在里头做了几个版本的。就好比你虽然不是主程,但也是项目里的高级程序了,把项目 copy 回去改改重新跑应该不难吧。难的是改方案,改架构。
ndxxx
1 天前
除了有 deepseek 的因素以外,meta 在 llama3 到 4 期间,ai 实验室经过了很多人事变动和办公室 drama 。

多关注一下湾区的科技公司,你会发现科技圈的 drama 比洼地娱乐猪圈的 drama 有趣太多了😁
iv8d
23 小时 32 分钟前
第一国内卷,都是加班往前冲。第二可以蒸馏了啊。第三很多开源模型,照抄不会么
smlcgx
22 小时 41 分钟前
挖天才少女 1 是评估冷启动算力,2 是流量。小米别的不行,搞流量和抄作业还不会吗
lzxz1234
11 小时 58 分钟前
所有看着最高端的技术、包括航天 原子弹 芯片看似门槛高难度大,实际最关键的只在那一两个人,之后才是团队和这一两个人能调动的资源,所以小米能造出来就比较容易解释了
Seck
11 小时 56 分钟前
学日本那一套

国内厂商之间,不做技术壁垒,相互之间默认技术共享

比如:云,国内押注云技术的只有阿里巴巴

最后结果,到处都是云,阿里鸡毛钱没赚到

亚马逊押注云,成功把云计算变成第一营收业务,阿里还是卖货的,人家变成了云计算公司,你滚来滚去还是靠电商

相互之间技术共享都是默认的
heyitsme
8 小时 55 分钟前
招厉害的人,投足够多的钱,基于成熟的架构改巴改巴,就能做成国内 top 的水平,但是要做成世界级还需要长期深耕
wangyang233
8 小时 15 分钟前
要拿 mate 对比国内公司的话可以对比百度。。都是起了个大早啥也没弄出来的代表

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1217599

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX