每日验证 · 最近一次:2026-06-16 16:05 UTC
我们如何 证明诚实
四条承诺,每条都可独立验证。任一失败,当期账单全额退款 —— 不用提工单,不用扯皮。
🔀
1. 一个模型名 → 一个官方上游
claude-* 走 Anthropic,gpt-* 走 OpenAI,gemini-* 走 Google。不做蒸馏替身,不在高负载下悄悄降级。
绝不替换
🪞
2. 不注入 prompt,不改写响应
你的请求体按字节原样转发。唯一的编辑是替换鉴权 key,以及(可选、需显式开启)OpenAI ↔ Anthropic 协议互转。
字节一致
📏
3. 每日基准对齐,原始数据公开
每 24 小时用相同参数跑 MMLU-Pro / GSM8K / HumanEval 样本,分别经 VoltAI 和直连官方,公开差值。目标 ≤ 1.5%。
Δ ≤ 1.5%
🔐
4. 自带 Key (零信任模式)
企业版可配置自己的上游 API Key。VoltAI 只做鉴权、计量、限流 —— 从不接触模型输出。
零信任
今日对齐快照
每日 00:05 UTC 自动生成。下表是当前实时读数。原始评测日志见 github.com/voltai/integrity-eval。
| 模型 | 上游 | MMLU-Pro | GSM8K | HumanEval | Δ vs 直连 | 状态 |
|---|---|---|---|---|---|---|
| DeepSeek API | DeepSeek | — | 90.0% / 90.0% | — | +0.00pp | 通过 |
| Claude family | Anthropic | — | — | — | — | 待测 |
| ChatGPT / GPT family | OpenAI | — | — | — | — | 待测 |
| Gemini family | — | — | — | — | 待测 | |
| Open-source deployments | VoltAI-owned hardware | — | — | — | — | 待测 |
别信我们 —— 自己验证。
领 $5 免费额度自己跑。我们的公开评测仓库可以复现上表的每个数字。对不上就退款。