阿里云 Token Plan:一次加价不加量的定价实验
阿里云百炼的 Token Plan 表面上是一次产品升级:统一 Credits、支持多模型、兼容主流 AI 编程和 Agent 工具。但从原来的 Coding Plan 用户视角看,它更像一次计费口径的重写。原来用户看到的是 200 元一个月、90,000 次模型调用;现在用户看到的是 198、698、1398 元三个坐席档位,以及一套不够直观的 Credits 抵扣系统。
如果只看 qwen3.6-plus,并采用一个偏乐观的 AI 编程假设:输入输出比 20:1,输入缓存命中率 80%,那么 Token Plan 标准坐席约等于 226M 总 tokens,高级坐席约 905M,总享坐席约 2.26B。听上去不少,但对照 Coding Plan Pro 的 200 元/月、90,000 次请求,它的优势并不明显。标准坐席想覆盖 90,000 次调用,平均每次只能有约 2,514 tokens;高级坐席才放宽到约 10,057 tokens,但价格已经涨到 698 元。
价格先涨
Coding Plan Pro 的官方页面写得很直接:价格为 200 元/月,用量限制是每 5 小时 6,000 次请求、每周 45,000 次请求、每月 90,000 次请求。它还说明单次提问会按实际“模型调用次数”扣除额度,简单任务约 5-10 次,复杂任务约 10-30+ 次。也就是说,这不是纯粹的聊天次数,而是面向 AI 编程工具的一套调用额度。
Token Plan 则把产品拆成三个坐席:标准坐席 198 元/月,对应 25,000 Credits;高级坐席 698 元/月,对应 100,000 Credits;尊享坐席 1398 元/月,对应 250,000 Credits。问题在于,官方给标准坐席的定位是“轻度使用 AI 辅助的团队成员”,而“日常高频使用 AI 编程”的位置被放到了 698 元的高级坐席。
这就是最刺眼的地方:如果把 Coding Plan Pro 视作原来的 AI 编程主力套餐,那么 Token Plan 中真正对标“日常高频 AI 编码”的套餐从 200 元跳到 698 元,价格约为 3.49 倍。尊享坐席则是 1398 元,约为 6.99 倍。价格涨了,但官方没有给出一个像 90,000 次请求那样直观的等价上限。
| 套餐 | 官方价格 | 官方额度 | 面向场景 |
|---|---|---|---|
| Coding Plan Pro | ¥200/月 | 90,000 次请求/月 | AI 编程工具调用 |
| Token Plan 标准 | ¥198/月 | 25,000 Credits/月 | 轻度 AI 辅助 |
| Token Plan 高级 | ¥698/月 | 100,000 Credits/月 | 日常高频 AI 编码 |
| Token Plan 尊享 | ¥1,398/月 | 250,000 Credits/月 | 重度依赖 AI 编码 |
额度变暗
Credits 最大的问题不是一定贵,而是不直观。Token Plan 官方示例以 qwen3.6-plus 计算:8,349 输入 tokens 消耗 1.67 Credits,40,794 缓存 tokens 消耗 0.82 Credits,573 输出 tokens 消耗 0.69 Credits。倒推可得,普通输入约 0.2 Credits/1K tokens,缓存输入约 0.02 Credits/1K tokens,输出约 1.2 Credits/1K tokens。
按照输入输出 20:1、输入缓存命中 80% 来算,每 21 个总 tokens 中,有 4 个普通输入 tokens、16 个缓存输入 tokens、1 个输出 token。对应消耗是 0.00232 Credits。也就是说,1 Credit 约等于 9,052 个总 tokens。
这个假设已经相当友好,因为它假设 80% 输入都能稳定命中缓存。即便如此,Token Plan 标准坐席的 25,000 Credits 也只是约 226M 总 tokens;高级坐席 100,000 Credits 约 905M;尊享坐席 250,000 Credits 约 2.26B。把它换算回“每月 90,000 次调用”的口径,标准坐席平均每次调用只有约 2,514 tokens,高级坐席约 10,057 tokens,尊享坐席约 25,144 tokens。
| Token Plan 档位 | Credits | 约总 tokens | 若按 90,000 次调用折算 |
|---|---|---|---|
| 标准坐席 | 25,000 | 226M | 2,514 tokens/次 |
| 高级坐席 | 100,000 | 905M | 10,057 tokens/次 |
| 尊享坐席 | 250,000 | 2.26B | 25,144 tokens/次 |
| 共享用量包 | 625,000 | 5.66B | 62,859 tokens/次 |
AI 编程不是短问短答。一次 Agent 调用里,系统提示词、工具定义、代码片段、检索结果、历史消息、错误日志都会进入上下文。把 90,000 次调用平均压到 2,514 tokens,在真实编程场景里并不宽松。高级坐席的 10,057 tokens/次看起来更合理,但它的价格已经不是 200 元,而是 698 元。
折扣有限
再换一个角度,不和 Coding Plan 比,只和 qwen3.6-plus 官方按量价格比。阿里云模型价格页显示,qwen3.6-plus 在 0<Token≤256K 档位下,输入为 2 元/百万 tokens,输出为 12 元/百万 tokens。上下文缓存页显示,显式缓存命中按输入单价 10% 计费,隐式缓存命中按输入单价 20% 计费。
仍然使用输入输出 20:1、缓存命中 80% 这个假设。如果按显式缓存 10% 计算,官方按量调用的等效成本约为 1.105 元/百万总 tokens。Token Plan 折算后的成本是:标准坐席约 0.875 元/百万总 tokens,高级坐席约 0.771 元/百万总 tokens,尊享坐席约 0.618 元/百万总 tokens,共享用量包约 0.884 元/百万总 tokens。
这意味着 Token Plan 相对官方按量价并不是“骨折价”。标准坐席约 7.92 折,高级坐席约 6.98 折,尊享坐席约 5.59 折,共享用量包约 8 折。只有在尊享坐席并且用满额度时,折扣才算明显;而高级坐席这个“日常高频 AI 编码”的主力档位,大约只是 7 折。
| 套餐 | 等效成本 | 相当于官方按量价 |
|---|---|---|
| Token Plan 标准 | ¥0.875 / 1M 总 tokens | 7.92 折 |
| Token Plan 高级 | ¥0.771 / 1M 总 tokens | 6.98 折 |
| Token Plan 尊享 | ¥0.618 / 1M 总 tokens | 5.59 折 |
| 共享用量包 | ¥0.884 / 1M 总 tokens | 8.00 折 |
如果按隐式缓存 20% 输入价对比,Token Plan 会更便宜一些:标准约 6.96 折,高级约 6.13 折,尊享约 4.92 折,共享包约 7.03 折。但这个对比反而说明问题:Token Plan 真正的优势不是相对 Coding Plan 的量更大,而是相对官方按量价有一定折扣。它更像企业采购折扣包,而不是原来那个 200 元/月的 AI 编程爽用套餐。
结论
Token Plan 当然有合理性:统一 Credits,覆盖文本、图像、多模型和团队坐席,也能让企业预算更可控。但如果问题是“它是否延续了 Coding Plan 对 AI 编程用户的性价比”,答案并不好看。
从实际数据看,Coding Plan Pro 是 200 元/月、90,000 次模型调用;Token Plan 中被官方描述为“日常高频 AI 编码”的高级坐席是 698 元/月。qwen3.6-plus 按 20:1 输入输出和 80% 缓存命中折算,高级坐席约 905M 总 tokens,摊到 90,000 次调用只有约 10K tokens/次。它不是不能用,而是把原来清晰、宽松、低价的请求额度,换成了更贵、更抽象、需要用户自己反推的 Credits。
所以这次变化最准确的评价是:Token Plan 不是单纯升级,而是一次加价不加量的计费重构。对企业采购,它可能更好管理;对原来的 AI 编程重度用户,它更像是在为同样的 qwen3.6-plus 支付更高的不确定性溢价。