企业内部搭满足 10 个人开发用的开源模型,得投多少钱?

15 小时 11 分钟前
 jedeft

跑个 glm 5.2 50 万能够不?

3008 次点击
所在节点    程序员
34 条回复
loryyang
11 小时 15 分钟前
想啥呢,要是能这么搞,还有人买 token 嘛……从性价比来讲,肯定是不行的
当然你一定要说数据隐私问题,那……得加钱
coefu
10 小时 46 分钟前
glm5.1 Q8 模型大小 811G ,10 个人并发的 1M context kvcache ,算 Q4 压缩,一个人大概留 100G ,因为 agent 回反复读 context ,那么 10 个人就得 1T 。所以你要准备 2T 左右 gmem 的环境,目前能买到的 H20 单卡 96G ,起码准备 20 张,单机 8 卡,准备 3 台机器。

h20 96G. ebay 上目前大概 8w 一张,卡就要 160w ,算 40w 能搞到 3 台服务器,外加网络。200w 起步,还要自己搞环境,另外电费另算。
Solix
9 小时 27 分钟前
电费是大头啊,兄弟,你试试一个月不得烧你个几十万
haoofun
9 小时 22 分钟前
划不来的吧,白天都上班抢算力,晚上又没人用,我觉得这个账目前算不过来
sn0wdr1am
8 小时 54 分钟前
目前看起来,本地部署,远远没有性价比。

除非预算不限,隐私无限。
Co1e
8 小时 22 分钟前
真的贵,因为我是卖 it 硬件产品的,不如买 token 了
limusi
7 小时 31 分钟前
给你个市场的参考..
我今天代购了 5 个 Premium, 正儿八经国内公司公对公, 开票和签合同一套下来, 6500/月;
这个是原汁原味的 claude team 账号
换言之 10 个人就是 1 万 3

50 万永久其实可以, 但是明智的老板, 会选择月付, 因为 AI 发展日新月异..
与其有优惠半价绑死 1 年, 还不如短租保持灵活,随时能跳槽
NathanInMac
7 小时 30 分钟前
@limusi 还不是违法。。
limusi
7 小时 24 分钟前
@NathanInMac 不至于, 吧
paranoiagu
7 小时 22 分钟前
glm 这么大的模型,私有化部署还是算了
qwen 80 那个可以考虑,不要说模型不够聪明🤫🤫
m1nm13
6 小时 45 分钟前
50 万看不起谁呢?没实力就去买 token
xiaomushen
6 小时 16 分钟前
@limusi 还是灰色的,不合规
firefox12
5 小时 36 分钟前
我想问下 google 那个 gemini 和 chatgpt 都是免费给我们用, 那得准备多少张卡 给全世界一起用啊?
limusi
4 小时 11 分钟前
@xiaomushen 这还是解释权之争, 意义不大, 我们还是回归真正务实高效的解决问题之上

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1221049

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX