需要大概 500 亿 token,现在用什么方案比较好?

10 小时 34 分钟前
 LeeReamond

计算了一下批量任务大概需要 500 亿左右,输入输出比大概在 20:1 ,需要 deepseek v4 pro 及以上智商的模型。

不知道有没有比较熟悉各种 tokenplan 的老哥指条路,谁家比较便宜。

目前用的是 mimo v2.5 pro 的 tokenplan ,估算了一下要几千块钱,还是很贵啊。。。

1148 次点击
所在节点    问与答
14 条回复
imlonghao
10 小时 26 分钟前
别单算输入输出比,缓存率也得考虑啊
soulflysimple123
9 小时 51 分钟前
opencode go
Censhuang
9 小时 49 分钟前
给个方向:租算力去自己推理?
rotor1996
9 小时 5 分钟前
中转站啊
qili36585009
9 小时 3 分钟前
推荐你用中转站的 gpt5.4 相对来说还是很便宜的
wuxkwnjjwoxk
8 小时 51 分钟前
收雷总送的 mimo 额度呀,我 max plan 还有 900 亿 credit ,可出
rubi
8 小时 47 分钟前
来用中转站吧
afkool
8 小时 43 分钟前
中转呗。。当然自己买 Pro20 最划算。
huahuaccc
8 小时 32 分钟前
500 亿 token ,中转也便宜不到几千块啊
LeeReamond
7 小时 8 分钟前
@imlonghao 缓存率很低,如果高的话就用 deepseek 了,缓存率看了一下 10%左右。


@rotor1996
@rubi
@afkool 中转靠谱么,中转也要走官方,它的利润点在哪里,感觉都是以次充好
noqwerty
6 小时 47 分钟前
试一下这个缓存率也很低吗 https://github.com/esengine/deepseek-reasonix
sakurajiayou
6 小时 43 分钟前
看看我之前发的几个贴子,肯定能解决你的问题
106npo
3 小时 21 分钟前
缓存率这么低的话,minimax 吧,预计 3000 多,但你得用一个月跑
409164
1 小时 2 分钟前
mbp 本地模型考虑一下?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1218571

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX