[送 $10] 被中转站扣费搞怕了,做了个工具专门看中转站 usage 透不透明、缓存命中问题

5 小时 16 分钟前
 huangyin0514
工具地址: https://aiapidoctor.com

最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。

折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填

(比如 模板就有空值扣费的问题,必须手动查缺补漏才行)

比如;

- 你不知道这次请求到底用了多少 token
- usage 字段给不全
- prompt_tokens / completion_tokens 看不明白
- max_tokens 到底有没有生效
- 商家说 98% 缓存,但 API 里看不到任何 cached_tokens 证据
- 一个很短的 OK 回复,usage 里却显示一堆 token
- 后台余额到底是不是按你理解的方式在扣

很多时候,用户讨论中转站会问:

“这个站稳不稳?”
“这个站真不真?”
“这个站是不是 Pro 反代?”
“这个站有没有缓存?”
“这个站会不会偷扣?”

但这些问题如果只靠嘴说,很容易变成口水仗。

所以我最近做了一个小工具:

AI API Doctor

它的核心不是“鉴定真假模型”,而是先帮你看一件更实际的事:

这个 API 的扣费信号是否透明。

如果不透明,或者漏洞不修,风险就比较大
---

目前主要测这些:

1. usage 是否完整

会看 API 返回里有没有:

- prompt_tokens
- completion_tokens
- total_tokens

如果 usage 缺失,或者字段不完整,用户就很难核对真实消耗。

2. token 是否异常

会做一些短请求测试,比如只让模型回复 OK 。

正常情况下,极短回复不应该出现很离谱的 completion_tokens 。

如果短回复 token 异常偏高,工具会提示:

“存在扣费不可解释风险。”

3. max_tokens 是否生效

有些接口虽然兼容 OpenAI 格式,但 max_tokens 不一定真的受控。

工具会测试:

max_tokens = 5 时,输出是否明显超出限制。

如果 max_tokens 不生效,长期使用时费用就可能不可控。

4. usage 是否稳定

同样的短请求重复几次,看 usage 字段是否大幅波动。

如果同样的 prompt ,token 统计波动很大,那至少说明这个接口的扣费可审计性不太好。

5. 缓存命中检测

现在很多商家会宣传:

“98% 缓存”
“缓存后极低成本”
“Opus 低倍率”

所以工具加了一个缓存命中检测。

它会用两次完全相同的长 prompt 做探测,看第二次 API 是否返回:

- cached_tokens
- cache_read_tokens
- cache_read_input_tokens

这类缓存命中字段。

如果检测到高缓存命中,会显示缓存命中分。

如果 API 没暴露缓存字段,它不会直接说商家造假,只会显示:

“未验证,API 未暴露缓存字段,无法验证缓存宣传。”

这点很重要。

因为有些上游确实可能有缓存,但中转接口不一定把字段透出来。
工具只基于 API 响应给证据,不做过度判断。

---

除了扣费相关,它也顺手测了几个辅助项:

- 模型能力是否有明显异常
- 稳定性采样
- Base URL / Key / Model 是否兼容
- Cline / Continue 配置是否可导出
- 来源透明度是否异常

但我自己觉得最有价值的还是:

usage 、token 、缓存、max_tokens 。

因为这些直接关系到钱。

---

使用方式:

1. 打开 https://aiapidoctor.com
2. 填 Base URL
3. 填 API Key
4. 填 Model ID ,或者点自动识别模型
5. 点击检测
6. 拿到一张验货报告图

检测会发起少量测试请求,页面里会提示:

预计消耗低于 $0.05

API Key 只在当前浏览器内用于本次检测,不会上传到 AI API Doctor 服务器。

如果不想暴露 Base URL ,可以直接用工具里的复制验货分功能,或者保存分享图,Base URL 会自动脱敏。

---

我想说明一下边界:

这个工具不能证明:

- 商家的真实成本
- 商家的真实上游合同
- 商家的真实倍率
- 商家到底有没有人工补贴
- 法律意义上的真假

它能做的是:

把 API 层能看到、能复现的信号测出来。

比如:

- usage 是否完整
- token 是否异常
- max_tokens 是否受控
- cached_tokens 是否存在
- 稳定性是否波动
- 模型能力是否明显掉档

我觉得这比单纯问“这站真不真”更有用。

---

这次想邀请大家帮我灰测一下。

你可以拿自己正在用的 OpenAI-compatible API / 中转站来测。

欢迎在楼里发:

1. 验货分( API Doctor 验货报告)
2. Link-AI 注册 ID 数字

注意:

不要发 API Key 。
不要发完整敏感 Base URL 。
工具保存图默认会脱敏 Base URL 。

---

福利:

为了收集更多真实样本,本帖灰测期内:

在本帖回复:

- AI API Doctor 验货截图
- Link-AI 注册 ID 数字

我手动赠送 $10 API 余额。

注册链接:
https://link-ai.cc

ID 可以在个人信息页查看。

我每天晚上集中处理一次,并在楼层回复已加。

这个福利主要是感谢大家提供真实测试样本。
工具本身不限制只能测 Link-AI ,也欢迎测其他站。
251 次点击
所在节点    推广
7 条回复
huangyin0514
5 小时 15 分钟前
回复模板:
粘贴获得的验货分:
Link-AI 注册 ID:
huangyin0514
5 小时 14 分钟前
最后欢迎各位大佬来打脸。

尤其欢迎发这些情况:

- usage 缺失
- cached_tokens 不返回
- 短回复 token 很高
- max_tokens 不生效
- 稳定性很抖
- 分数和实际体验不一致

我会根据真实反馈继续改!
huangyin0514
5 小时 1 分钟前
第一次做这种工具,希望大家多多指正= =
huangyin0514
4 小时 53 分钟前
AI API Doctor 验货报告
URL: https://api***.cc/v1
验货分:69.9/100 ,Limited
扣费透明度:中风险
缓存命中检测:良好 (85.01%)
模型可信度:高风险
稳定性:中风险
来源透明度:家族匹配
主要建议:稳定性采样存在波动,可能影响 Cline 、Continue 等客户端体验。
决策:建议仅低成本测试,暂不建议用于高成本任务。
本报告仅基于可复现 API 信号,不构成最终证明。
ID:AID05201057-AEC6 · aiapidoctor.com
我刚自己测了下,分不是特别高 [捂脸] 绝对公平公正
huangyin0514
4 小时 41 分钟前
最好是生成一个临时的 key 来测试,这样最好!
lylgb
3 小时 54 分钟前



ID:234
huangyin0514
1 小时 46 分钟前
@lylgb 已送!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1214028

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX