Tokens 成本速算公式

先拆出输入和输出,再拆缓存与非缓存,最后按单价相加。这个页面既能看公式,也能直接算价格。

总 tokens = 输入 + 输出 支持缓存击中率 支持 20:1 等任意输入输出比 可切换 ≤272K / >272K 单价

一眼看懂的通用公式

设总 tokens 为 T,输入输出比为 a:b,缓存击中率为 h

输入 tokens = T × a / (a + b)
输出 tokens = T × b / (a + b)
缓存输入 = 输入 × h,非缓存输入 = 输入 × (1 - h)
总成本 = 非缓存输入/1,000,000 × 输入价 + 缓存输入/1,000,000 × Cache Read 价 + 输出/1,000,000 × 输出价

如果你的条件固定为 20:1 + 80% 缓存命中 + ≤272K 档价格,那么每 100 万总 tokens 的成本约是 $1.38095

换句话说,总成本 ≈ 总 tokens(百万) × 1.38095。所以 1 亿总 tokens 约 $138.10,2 亿约 $276.19

常用价格预设

≤272K 档

Input: $2.5 / 1M

Output: $15 / 1M

Cache Read: $0.25 / 1M

>272K 档

Input: $5 / 1M

Output: $22.5 / 1M

Cache Read: $0.5 / 1M

两个现成例子

1 亿总 tokens,20:1,80% 缓存命中,≤272K 档

成本约 $138.10

2 亿总 tokens,20:1,80% 缓存命中,≤272K 档

成本约 $276.19

同样条件但按 >272K 档

每 100 万总 tokens 约 $2.40476

在线速算

默认已经填好你前面那组参数。改数字后会自动更新。

输入 tokens-
输出 tokens-
缓存输入-
非缓存输入-
输入成本-
输出成本-
缓存成本-
总成本-

说明:这里默认把“总 tokens”理解为 输入 + 输出 的总和。如果你说的 tokens 只指输入,那就要换一套算法。