每日验证 · 最近一次:2026-06-16 16:05 UTC

我们如何 证明诚实

四条承诺,每条都可独立验证。任一失败,当期账单全额退款 —— 不用提工单,不用扯皮。

🔀

1. 一个模型名 → 一个官方上游

claude-* 走 Anthropic,gpt-* 走 OpenAI,gemini-* 走 Google。不做蒸馏替身,不在高负载下悄悄降级。

绝不替换
🪞

2. 不注入 prompt,不改写响应

你的请求体按字节原样转发。唯一的编辑是替换鉴权 key,以及(可选、需显式开启)OpenAI ↔ Anthropic 协议互转。

字节一致
📏

3. 每日基准对齐,原始数据公开

每 24 小时用相同参数跑 MMLU-Pro / GSM8K / HumanEval 样本,分别经 VoltAI 和直连官方,公开差值。目标 ≤ 1.5%。

Δ ≤ 1.5%
🔐

4. 自带 Key (零信任模式)

企业版可配置自己的上游 API Key。VoltAI 只做鉴权、计量、限流 —— 从不接触模型输出。

零信任

今日对齐快照

每日 00:05 UTC 自动生成。下表是当前实时读数。原始评测日志见 github.com/voltai/integrity-eval。

模型上游MMLU-ProGSM8KHumanEvalΔ vs 直连状态
DeepSeek APIDeepSeek90.0% / 90.0%+0.00pp通过
Claude familyAnthropic待测
ChatGPT / GPT familyOpenAI待测
Gemini familyGoogle待测
Open-source deploymentsVoltAI-owned hardware待测

别信我们 —— 自己验证。

领 $5 免费额度自己跑。我们的公开评测仓库可以复现上表的每个数字。对不上就退款。