阿里云 Token Plan：一次加价不加量的定价实验

阿里云百炼的 Token Plan 表面上是一次产品升级：统一 Credits、支持多模型、兼容主流 AI 编程和 Agent 工具。但从原来的 Coding Plan 用户视角看，它更像一次计费口径的重写。原来用户看到的是 200 元一个月、90,000 次模型调用；现在用户看到的是 198、698、1398 元三个坐席档位，以及一套不够直观的 Credits 抵扣系统。

如果只看 qwen3.6-plus，并采用一个偏乐观的 AI 编程假设：输入输出比 20:1，输入缓存命中率 80%，那么 Token Plan 标准坐席约等于 226M 总 tokens，高级坐席约 905M，总享坐席约 2.26B。听上去不少，但对照 Coding Plan Pro 的 200 元/月、90,000 次请求，它的优势并不明显。标准坐席想覆盖 90,000 次调用，平均每次只能有约 2,514 tokens；高级坐席才放宽到约 10,057 tokens，但价格已经涨到 698 元。

Token Plan 概述 Coding Plan 概述模型价格上下文缓存

价格先涨

Coding Plan Pro 的官方页面写得很直接：价格为 200 元/月，用量限制是每 5 小时 6,000 次请求、每周 45,000 次请求、每月 90,000 次请求。它还说明单次提问会按实际“模型调用次数”扣除额度，简单任务约 5-10 次，复杂任务约 10-30+ 次。也就是说，这不是纯粹的聊天次数，而是面向 AI 编程工具的一套调用额度。

Token Plan 则把产品拆成三个坐席：标准坐席 198 元/月，对应 25,000 Credits；高级坐席 698 元/月，对应 100,000 Credits；尊享坐席 1398 元/月，对应 250,000 Credits。问题在于，官方给标准坐席的定位是“轻度使用 AI 辅助的团队成员”，而“日常高频使用 AI 编程”的位置被放到了 698 元的高级坐席。

这就是最刺眼的地方：如果把 Coding Plan Pro 视作原来的 AI 编程主力套餐，那么 Token Plan 中真正对标“日常高频 AI 编码”的套餐从 200 元跳到 698 元，价格约为 3.49 倍。尊享坐席则是 1398 元，约为 6.99 倍。价格涨了，但官方没有给出一个像 90,000 次请求那样直观的等价上限。

套餐	官方价格	官方额度	面向场景
Coding Plan Pro	¥200/月	90,000 次请求/月	AI 编程工具调用
Token Plan 标准	¥198/月	25,000 Credits/月	轻度 AI 辅助
Token Plan 高级	¥698/月	100,000 Credits/月	日常高频 AI 编码
Token Plan 尊享	¥1,398/月	250,000 Credits/月	重度依赖 AI 编码

Coding Plan 概述 Token Plan 概述

额度变暗

Credits 最大的问题不是一定贵，而是不直观。Token Plan 官方示例以 qwen3.6-plus 计算：8,349 输入 tokens 消耗 1.67 Credits，40,794 缓存 tokens 消耗 0.82 Credits，573 输出 tokens 消耗 0.69 Credits。倒推可得，普通输入约 0.2 Credits/1K tokens，缓存输入约 0.02 Credits/1K tokens，输出约 1.2 Credits/1K tokens。

按照输入输出 20:1、输入缓存命中 80% 来算，每 21 个总 tokens 中，有 4 个普通输入 tokens、16 个缓存输入 tokens、1 个输出 token。对应消耗是 0.00232 Credits。也就是说，1 Credit 约等于 9,052 个总 tokens。

这个假设已经相当友好，因为它假设 80% 输入都能稳定命中缓存。即便如此，Token Plan 标准坐席的 25,000 Credits 也只是约 226M 总 tokens；高级坐席 100,000 Credits 约 905M；尊享坐席 250,000 Credits 约 2.26B。把它换算回“每月 90,000 次调用”的口径，标准坐席平均每次调用只有约 2,514 tokens，高级坐席约 10,057 tokens，尊享坐席约 25,144 tokens。

Token Plan 档位	Credits	约总 tokens	若按 90,000 次调用折算
标准坐席	25,000	226M	2,514 tokens/次
高级坐席	100,000	905M	10,057 tokens/次
尊享坐席	250,000	2.26B	25,144 tokens/次
共享用量包	625,000	5.66B	62,859 tokens/次

AI 编程不是短问短答。一次 Agent 调用里，系统提示词、工具定义、代码片段、检索结果、历史消息、错误日志都会进入上下文。把 90,000 次调用平均压到 2,514 tokens，在真实编程场景里并不宽松。高级坐席的 10,057 tokens/次看起来更合理，但它的价格已经不是 200 元，而是 698 元。

Token Plan 概述上下文缓存

折扣有限

再换一个角度，不和 Coding Plan 比，只和 qwen3.6-plus 官方按量价格比。阿里云模型价格页显示，qwen3.6-plus 在 0<Token≤256K 档位下，输入为 2 元/百万 tokens，输出为 12 元/百万 tokens。上下文缓存页显示，显式缓存命中按输入单价 10% 计费，隐式缓存命中按输入单价 20% 计费。

仍然使用输入输出 20:1、缓存命中 80% 这个假设。如果按显式缓存 10% 计算，官方按量调用的等效成本约为 1.105 元/百万总 tokens。Token Plan 折算后的成本是：标准坐席约 0.875 元/百万总 tokens，高级坐席约 0.771 元/百万总 tokens，尊享坐席约 0.618 元/百万总 tokens，共享用量包约 0.884 元/百万总 tokens。

这意味着 Token Plan 相对官方按量价并不是“骨折价”。标准坐席约 7.92 折，高级坐席约 6.98 折，尊享坐席约 5.59 折，共享用量包约 8 折。只有在尊享坐席并且用满额度时，折扣才算明显；而高级坐席这个“日常高频 AI 编码”的主力档位，大约只是 7 折。

套餐	等效成本	相当于官方按量价
Token Plan 标准	¥0.875 / 1M 总 tokens	7.92 折
Token Plan 高级	¥0.771 / 1M 总 tokens	6.98 折
Token Plan 尊享	¥0.618 / 1M 总 tokens	5.59 折
共享用量包	¥0.884 / 1M 总 tokens	8.00 折

如果按隐式缓存 20% 输入价对比，Token Plan 会更便宜一些：标准约 6.96 折，高级约 6.13 折，尊享约 4.92 折，共享包约 7.03 折。但这个对比反而说明问题：Token Plan 真正的优势不是相对 Coding Plan 的量更大，而是相对官方按量价有一定折扣。它更像企业采购折扣包，而不是原来那个 200 元/月的 AI 编程爽用套餐。

模型价格上下文缓存

结论

Token Plan 当然有合理性：统一 Credits，覆盖文本、图像、多模型和团队坐席，也能让企业预算更可控。但如果问题是“它是否延续了 Coding Plan 对 AI 编程用户的性价比”，答案并不好看。

从实际数据看，Coding Plan Pro 是 200 元/月、90,000 次模型调用；Token Plan 中被官方描述为“日常高频 AI 编码”的高级坐席是 698 元/月。qwen3.6-plus 按 20:1 输入输出和 80% 缓存命中折算，高级坐席约 905M 总 tokens，摊到 90,000 次调用只有约 10K tokens/次。它不是不能用，而是把原来清晰、宽松、低价的请求额度，换成了更贵、更抽象、需要用户自己反推的 Credits。

所以这次变化最准确的评价是：Token Plan 不是单纯升级，而是一次加价不加量的计费重构。对企业采购，它可能更好管理；对原来的 AI 编程重度用户，它更像是在为同样的 qwen3.6-plus 支付更高的不确定性溢价。