需要大概 500 亿 token，现在用什么方案比较好？

10 小时 34 分钟前

LeeReamond

计算了一下批量任务大概需要 500 亿左右，输入输出比大概在 20：1 ，需要 deepseek v4 pro 及以上智商的模型。

不知道有没有比较熟悉各种 tokenplan 的老哥指条路，谁家比较便宜。

目前用的是 mimo v2.5 pro 的 tokenplan ，估算了一下要几千块钱，还是很贵啊。。。

1148 次点击

所在节点

问与答

14 条回复

imlonghao

10 小时 26 分钟前

别单算输入输出比，缓存率也得考虑啊

soulflysimple123

9 小时 51 分钟前

opencode go

Censhuang

9 小时 49 分钟前

给个方向：租算力去自己推理？

rotor1996

9 小时 5 分钟前

中转站啊

qili36585009

9 小时 3 分钟前

推荐你用中转站的 gpt5.4 相对来说还是很便宜的

wuxkwnjjwoxk

8 小时 51 分钟前

收雷总送的 mimo 额度呀，我 max plan 还有 900 亿 credit ，可出

rubi

8 小时 47 分钟前

来用中转站吧

afkool

8 小时 43 分钟前

中转呗。。当然自己买 Pro20 最划算。

huahuaccc

8 小时 32 分钟前

500 亿 token ，中转也便宜不到几千块啊

LeeReamond

7 小时 8 分钟前

@imlonghao 缓存率很低，如果高的话就用 deepseek 了，缓存率看了一下 10%左右。

@rotor1996
@rubi
@afkool 中转靠谱么，中转也要走官方，它的利润点在哪里，感觉都是以次充好

noqwerty

6 小时 47 分钟前

试一下这个缓存率也很低吗 https://github.com/esengine/deepseek-reasonix

sakurajiayou

6 小时 43 分钟前

看看我之前发的几个贴子，肯定能解决你的问题

106npo

3 小时 21 分钟前

缓存率这么低的话，minimax 吧，预计 3000 多，但你得用一个月跑

409164

1 小时 2 分钟前

mbp 本地模型考虑一下？

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1218571

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.