企业内部搭满足 10 个人开发用的开源模型,得投多少钱?

13 小时 57 分钟前
 jedeft

跑个 glm 5.2 50 万能够不?

2980 次点击
所在节点    程序员
34 条回复
sagnitude
13 小时 43 分钟前
加一两个零吧
realpg
13 小时 41 分钟前
想回收残值,就 H200*8 一体机一台或者两台 看实力

想便宜且不怕费电 可以考虑找找渠道的垃圾华为老方案的 910B 两台跑 deepseek v4 pro/flash 可以降低成本 甚至有渠道几十万就能搞定一台
fbu11
13 小时 37 分钟前
参考前两天的这个帖子 https://www.v2ex.com/t/1220819
本地部署的机器要求蛮高的,不如直接买 token ,大概你们想的是安全问题,但自己搭建的真的慢,智商也不太够用
elehayym1618
13 小时 35 分钟前
8 张 h20 勉强能跑吧,光服务器就是 150w 。有这个钱还是充钱买 token 吧
MoozLee
13 小时 34 分钟前
200w 起吧
jackOff
13 小时 30 分钟前
50 万你只能淘宝买个 deepseek 2 这种一体机
yopv2
12 小时 9 分钟前
@realpg 910B 就算了吧
realpg
12 小时 6 分钟前
@yopv2 #7
不怕费电 纯跑 deepseek v4 flash/pro 还是能用的
降低基础投入
我们白嫖了很多客户单位的一体机 搭了集群跑 deepseek v4
jimrok
12 小时 3 分钟前
首先,你这些算卡,3 年折旧下来你就受不了。第二,模型都再更新,刚刚迈入可用的状态。海外的模型,1 万亿参数规模都只是 flash ,mini 级别,刚刚能够用。后续前沿模型出来,参数变大,你这点预算根本抗不下。自己部署没有能力对模型调优,你的成本会非常高,远远高于模型的套餐成本。
xiaomushen
11 小时 55 分钟前
具体什么模型?如果是 glm5.1/5.2 这种,5-10 并发至少需要两台 8 卡 H20
syubo2810
11 小时 54 分钟前
本地部署只适合严格保密场景和要自己优化大模型的场景,其他的都是云端便宜,不说硬件随随便便大几百万,电费也是一大笔开销,按 deepseek 的价格,如果用的商电,就真只够电费了,硬件白送了
nevin47
11 小时 50 分钟前
@elehayym1618 5-10 人一台不够,至少 2 台。如果做互连还要再贵点
peteretep
11 小时 34 分钟前
才 10 个人,如果不是必须自己搭,完全可以给每个人开 codex 套餐。

能干和干得好,有天大的差别
jedeft
11 小时 33 分钟前
@realpg 啥一体机?用 cpu 算吗?
jinsongzhaocn
11 小时 32 分钟前
目前纯本地部署一定不划算,哪怕硬件够便宜了,每天更新模型的人力成本也不省心。最佳组合是本地+云服务。
xubeiyou
11 小时 26 分钟前
真建议买 token 。。。。
sagnitude
10 小时 52 分钟前
@jedeft 商家给你装好的整体机柜,里面装好了服务器和显卡和互联设施和硬盘,也装好了模型,一台三四百万,你需要两台
maskerTUI
10 小时 13 分钟前
硬件成本至少要 500W 才能跑完整的 GLM5.2 ,每个月电费至少也要两三万吧。不如直接买 token
zliea
10 小时 5 分钟前
可以按照模型文件大小/0.75 计算跑起来需要的显存。
不量化的版本 1.5T ,估计需要 2T 显存,然后再算价格。
PopRain
10 小时 2 分钟前
看了以上说法,token 要涨价,现在在圈地比较便宜😓

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1221049

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX