懂芯片的解惑:为什么英伟达可以造出可以训练 AI 的 GPU,其他芯片公司造不出来吗?

2024-06-02 23:51:08 +08:00
 sunzhuo
google 有自己的 TPU ,高通也有 NPU ,AMD 有 GPU 和 NPU ,为什么只有英伟达爆红?
3845 次点击
所在节点    问与答
27 条回复
Inn0Vat10n
2024-06-02 23:56:19 +08:00
就是造不出来,就算有一些场景下匹配的性能,也被 CUDA 这护城河拦住了
quake0day
2024-06-02 23:58:57 +08:00
20 年前你也可以问为什么只有英伟达可以称霸游戏显卡行业。为什么 3Dfx, ATI 都没能干掉 Nvidia 。
malusama
2024-06-03 00:08:06 +08:00
造的出来. 问题是前十年根本没人投资做方便通用计算的代码, 方便的调用 GPU 获得廉价高效的算力
英伟达在做就有了. 现在 AMD 仿照 CUDA 也在做
你做出来芯片了得有人给你写应用代码啊,
google 家开始 tensorflow 是很厉害, 还可以使用他们家 TPU, 问题是为啥最后大家都喜欢用 pytorch
k9982874
2024-06-03 00:21:52 +08:00
你看 nv 是爆红,实际 nv 布局显卡计算 10 几年,曾经还差点因为这事资金断掉差点破产
hGaHLRyC
2024-06-03 02:55:56 +08:00
做浮点算力卡的人多,但有 CUDA 的只此一家,而大家都用 CUDA 。
phrack
2024-06-03 03:52:27 +08:00
任何需要多人多组织协作的行业多半最后都会只剩一家或者一种技术占据 50%以上的份额,不然在这家公司用了这个技术,换一家公司就要换一套技术,社会运行和公司运营成本就会上升,个人发展也会越走越窄。

NV 耕耘多年,CUDA 无出其右,目前很难撼动。其中主要是 CUDA ,硬件现在公版甚至开源设计都很强了,但是软件是一个比硬件复杂的多的生态。

Chrome 浏览器最近几年强推 Manifest V3 但是根本无人能站出来挑战也是因为浏览器这个生态已经太复杂了,没有几百亿几千亿投入连个水花都起不来。希望 Firefox 能扛起大旗吧。
ladypxy
2024-06-03 06:33:49 +08:00
不是其他公司造不出来,是其他公司的性价比不行。同样价格下的算力 功耗比不过。
LeeReamond
2024-06-03 07:42:31 +08:00
矩阵推理核心恰恰是最容易造的,因为结构简单。

问题只是,造 GPU 容易,但你要重新实现一大套科学计算生态吗。。。
murmur
2024-06-03 08:18:01 +08:00
NV 真的是亲自下场做生态,大概 1060 那个年代 cuda 就有雏形了,你听说大模型都 3090 了
Greendays
2024-06-03 08:27:31 +08:00
怎么就造不出来了? AMD 不是有 MI300 么,性能比 NV 更强,大厂都是自有的生态,可以不用 CUDA 那一套。
kokutou
2024-06-03 08:42:08 +08:00
amd 算力也够, 但是生态已经在 nv 上建好了...
你有钱有时间有人重新造轮子吗?
msg7086
2024-06-03 09:12:01 +08:00
能造,但代价是什么呢,钱啊。你投 50 亿进去搞,马上就能给你搞出来差不多的东西。
CUDA 壁垒算什么,只要有钱,把 CUDA 上的生态全部重新搞一遍出来就行了。

但现实是,没有钱。

这其实很像 iPhone 上的生态。人家是第一个造出来的非开源智能手机系统,于是手机 App 必有 iOS 的份。安卓是第一个造出来的开源智能手机系统。你看看 Windows Phone ,第二个造出来的。第二个,而不是第一个,所以就寄了。

AMD 现在的定位就是想搞第一个开源的显卡计算生态( OpenCL/ROCm ),能不能搞成就看天了。但是他有个很大的弱点,就是企业不一定买账开源生态。企业不是普通用户,对开源项目的选择考量是不太一样的。
wulili
2024-06-03 09:32:00 +08:00
不是造不出来,主要是软件生态不好造,别人都习惯了用 CUDA 。
不过这种状态应该不会持续太长时间,天下苦 N 卡久矣。
mcthpj
2024-06-03 09:37:11 +08:00
话说, 如何看待老黄乳了热度被打压, 本来前天看到这新闻还挺兴奋, 结果一通搜貌似都没看到有上热搜, 只有寥寥看到有些讨论
Cooky
2024-06-03 09:37:24 +08:00
生态是没法弯道超车的
polobug
2024-06-03 09:40:16 +08:00
跟 linux 消费级永远干不掉 win 一个道理呀
june4
2024-06-03 09:42:35 +08:00
因为起了个大早,且高算力突然被需要,运气逆天。
再过几年就知道了,暴利只能是突击得到无法躺平持续,到时要么有统一的和 cuda 对干的 api,要么各家都做起来了
lDqe4OE6iOEUQNM7
2024-06-03 09:46:43 +08:00
虽然谷歌有 TPU ,但 TPU 主要用于谷歌内部的 AI 训练和推理服务。虽然谷歌提供了 TPU 服务(如 Google Cloud TPU ),但其生态系统和市场渗透率远不及英伟达的 CUDA 和 GPU 生态系统。
高通的 NPU 主要用于移动设备上的 AI 推理任务,其性能和用途与英伟达的 GPU 不同,且高通并未在 AI 训练领域投入大量资源。
AMD 虽然也有 GPU 和 NPU ,但其软件生态系统和市场推广不如英伟达。AMD 的 ROCm ( Radeon Open Compute )平台虽然提供了类似 CUDA 的功能,但其生态系统和支持的广泛性还未达到英伟达的水平
laminux29
2024-06-03 11:31:53 +08:00
历史原因。

1.CUDA 当年是一个第三方的爱好者搞出来的,不是 Nvidia 搞出来的。

2.老黄当年看到这个事情的潜力,向管理层申请,但管理层觉得风险大且鸡肋,就没同意。
老黄是坚持了很多年,背负了很多责任,搞定了很多别的大事,最后管理层才同意老黄搞这事的。
me1onsoda
2024-06-03 11:59:44 +08:00
可以造吧,有技术优势。用老黄的话说,你的 gpu 就是免费卖也卖不过我。建一个数据中心我省下的电费比 gpu 那点钱多太多了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1046182

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX