如题,一个 1M 上下文的模型,限速 1 分钟吞吐 1.2M token ,什么 Agent 工具能做到不限速使用?难道是 chat 场景……
1
fcten 1h 57m ago
因为不觉得有人会用...为什么放着 deepseek 官方的 api 不用用百炼的 api 啊?成本得高几十倍吧...
百炼的前缀缓存做的稀烂,价格还巨贵。百万上下文的 agent 场景怕是得用破产。 |