• 请不要在回答技术问题时复制粘贴 AI 生成的内容
sentinelK
V2EX  ›  程序员

阿里百炼的自建 DeepSeek 限速是 TPM 1.2M,这限速是拍脑袋的吗?

  •  
  •   sentinelK · 2h 36m ago · 382 views
    如题,一个 1M 上下文的模型,限速 1 分钟吞吐 1.2M token ,什么 Agent 工具能做到不限速使用?难道是 chat 场景……
    2 replies    2026-05-28 17:54:51 +08:00
    fcten
        1
    fcten  
       1h 57m ago
    因为不觉得有人会用...为什么放着 deepseek 官方的 api 不用用百炼的 api 啊?成本得高几十倍吧...
    百炼的前缀缓存做的稀烂,价格还巨贵。百万上下文的 agent 场景怕是得用破产。
    sentinelK
        2
    sentinelK  
    OP
       1h 54m ago
    @fcten 前几天 deepseek 官方 429 了一阵,于是为了应急,买了百炼的 5 折小包(30 抵 60),结果发现坑的不行。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3261 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 11:49 · PVG 19:49 · LAX 04:49 · JFK 07:49
    ♥ Do have faith in what you're doing.