我认为与采用 PCIe 的独显相比,使用同一内存加上大量带宽的方法可能会更有优势?

2021-10-22 18:13:10 +08:00
 junjie1475

我不知道我的计算对不对 举例说 RTX3090 显存是 936G/s 的带宽 加上 PCIE 最大带宽 32G/s 假设 CPU 将数据发送到 RTX 3090 进行处理,总有效带宽将为 (936 + 32) / 2 = 484 GB/s 如果 CPU 返回数据还会更低? 当然这只是我的猜想

834 次点击
所在节点    Apple
1 条回复
noe132
2021-10-22 18:35:59 +08:00
936GB/s 是 GPU 和显存之间的带宽。CPU 传数据到显存走 PCIE,上限就是 pcie 带宽 32GB/s
3090 显存 24G,理论上 1 秒都不需要就可以写满 24G 显存。就算是 pcie3.0,理论速度也只需要 1.5 秒就写满 24G 。

一般任务 CPU GPU 不需要传太多数据。实际游戏中,就算显卡插在了 pcie3.0x4 的插槽,也就是 4GB/s,fps 也不会降低很多。因为通常 gpu 没啥需要和 cpu 沟通的,自己一个人把活都干完了。更极端的情况,显卡挖矿,只需要插 pcie2.0x1 就能干活,因为显卡和 CPU 基本不传数据。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/809877

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX