Claude Fable 定价翻倍，顶尖 AI 正在变成奢侈品

2026 年 6 月 9 日，Anthropic 发布了 Claude Fable 5，一个专注复杂代码规划与生成的新模型。发布本身并不让人意外，但两条附带信息迅速点燃了开发社区的讨论：Fable 5 的 API 定价是上一代 Opus 4.8 的两倍；6 月 22 日之后，Fable 5 将从 Pro、Max 等订阅计划中移除，用户只能通过 API 调用或 usage credits 访问。

有开发者在 Reddit 上反馈，用 Max 20x 计划跑 Fable 5，每分钟消耗 2% 额度。Hacker News 上一位用户记录了自己一天的用量，Fable 5 的 API token 消耗在额度内就达到了 82.92 美元。能力强，但烧钱也快。

这不仅仅是一个模型的定价问题。当最顶尖的 AI 开始按能力等级分层定价，并且最高一级被移出普惠订阅，一个更棘手的问题浮出水面：最好的模型，谁在用？

两倍价格，以及一个倒计时

Anthropic 官方公告显示，Claude Fable 5 是首个公开发布的 Mythos 级别模型。Mythos 是 Anthropic 内部对最高能力模型的定级，此前仅供 Project Glasswing 合作伙伴使用。Fable 5 相当于 Mythos 5 的“公开发行版”，在精确构建代码结构、理解开发者深层需求等场景中，性能较 Claude Sonnet 有显著提升。

能力附带了直接的成本代价。据 Anthropic 官方定价页数据，Fable 5 API 输入价格为每百万 token 10 美元，输出价格为 50 美元。同为 Anthropic 旗下，Opus 4.8 的对应价格是 5 美元和 25 美元，Sonnet 4.6 是 3 美元和 15 美元。Fable 5 的输出价格是 Sonnet 的 3.3 倍。

访问窗口也有限制。Anthropic 确认，6 月 22 日前 Fable 5 包含在所有订阅计划中；6 月 23 日起，Fable 5 将从订阅计划移除，用户需使用 usage credits 才能调用。官方的表述是“容量允许时将恢复为标准订阅功能”，但没有给出时间表。

宾夕法尼亚大学沃顿商学院教授 Ethan Mollick 在他的博客 oneusefulthing.org 上发表了关于 Fable 5 的深度测评。他写道：“Fable 价格是 Opus 的两倍，token 消耗速度表明生产成本会‘非常高’。”Mollick 长期跟踪 AI 模型能力演进，这句判断指向的并非定价策略本身，而是模型运行的基础设施成本。

token 消耗速度有多快？Reddit 用户反馈，在 Claude Max 20x 计划下使用 Fable 5，每分钟消耗约 2% 的额度。这个计划每月定价 200 美元，按此速率，连续使用不到一小时就会耗尽整月额度。Hacker News 上的开发者 Simon Willison 记录了自己一天的 API 使用情况，额度内消耗达到 82.92 美元。

Fable 5 的定价和访问策略传达了一个信号：下一代模型的能力提升直接反映在价格乘数上。订阅计划的“免费试用期”只够用户建立使用习惯。当截止日期到来，用户面临两个选择：支付更不可控的 API 成本继续使用，或者退回到上一个等级的模型。

从 9 美元到 120 美元的分层

Fable 5 的定价不是孤例。把目前在售的主流模型 API 定价拉出来看，一条陡峭的价格光谱清晰可见。

据 Google 官方定价页，Gemini 3.5 Flash 的付费层输出价格为每百万 token 9 美元。OpenAI 官方定价页显示，GPT-5.4 输出价格为 15 美元，GPT-5.5 为 30 美元，GPT-5.5 Pro 为 120 美元。Anthropic 这边，Sonnet 4.6 输出价 15 美元，Opus 4.8 为 25 美元，Fable 5 为 50 美元。

从 Gemini 3.5 Flash 的 9 美元到 GPT-5.5 Pro 的 120 美元，最大价差超过 13 倍。这不再是简单的“高端 vs 低端”二分。厂商正在主动构建一个三层结构：底层是极低价的入门模型，承担普及和获客功能；中层是中等价位的高性能模型，面向日常开发需求；顶层是昂贵但能力最强的推理模型，目标用户是高频、高价值场景的使用者。

定价分层的背后，是能力等级的显性化。Anthropic 用 Sonnet、Opus、Fable、Mythos 四级划分模型能力，OpenAI 用标准版和 Pro 版区分 GPT-5 系列的不同规格，Google 则用 Flash 和 Pro 区分 Gemini 3 系列的定位。这些等级不再只是内部代号，而是直接映射到价格上。

更值得注意的变化发生在访问权上。在 Anthropic 官方定价页公布的模型列表中，Fable 5 被标注为“6 月 22 日前包含在订阅计划中”，Opus 4.8 和 Sonnet 4.6 则没有类似的时间限制。Anthropic 正在尝试一种新的分层方式：不是按能力高低给不同订阅等级分配不同模型，而是直接将顶级模型从订阅体系中剥离，单独建立 API 调用通道。

账单不可控的焦虑

单看每百万 token 50 美元的定价，放在企业采购场景里不算惊人。Claude Fable 的上下文窗口达 100 万 token，最大输出 12.8 万 token，一次完整的复杂任务可能消耗数万到数十万 token。Fable 5 作为推理模型，“思考更久、生成更多 token”不是设计缺陷，而是能力来源。模型在输出最终答案前会进行多步推理，每步都产生 token 消耗。

问题在于用户无法控制这个消耗量。一位用 Max 20x 计划的开发者每分钟烧掉 2% 额度，Simon Willison 一天消耗 82.92 美元。这些消耗发生在“试用期”内，属于计划内额度。6 月 22 日之后，类似的用量将直接转为 API 账单或 credits 扣减。

Token 作为一种计费单位，其消耗量由模型设计方决定，用户无法控制“用量”。把 AI 调用比作用电，核心矛盾在于用户既不能选择“省电模式”，也不能预测下一次查询会消耗多少“电”。一篇发布于 LinkedIn 的行业讨论文章将这种现象概括为“AI 税”的核心特征：“真正的 AI 税不仅是模型价格，而是不可预测性。”

这种不可预测性对个人开发者的冲击远大于企业。企业可以签订批量协议、设置预算上限、在团队内分摊成本。个人用户面对按量计费的 API，一次较真的调试可能就是整月订阅费。Hacker News 上一位用户评论说，“成本意识路由从锦上添花变成强制要求”。“成本意识路由”指的是在默认任务中使用便宜模型，只在必要时调用昂贵模型。在 Fable 5 之前，这更多是一种优化策略；Fable 5 的价格和消耗速度，让这种策略变成了不做就面临超支的刚性配置。

主流 API 都提供不同模型的调用接口，开发者可以自行设定路由逻辑。但这要求用户具备编程能力、理解模型差异、愿意接受降级模型可能带来的质量损失。每多一层门槛，就多一批人被挡在门外。

两百美元月费也买不到全通票

访问权的分层同样在发生变化。Claude Fable 5 的策略是：6 月 22 日之前，所有付费用户都能用；6 月 22 日之后，即使支付最高 200 美元月费的 Max 20x 用户也不能直接访问，需要通过 usage credits 调用 API。

相比之下，OpenAI 的访问权策略是另一条路径。据 ChatGPT 官方定价页，ChatGPT Pro 提供 100 美元和 200 美元两个层级，均可访问 GPT-5 Pro。更高层的模型能力对应更高层的订阅等级，但订阅本身仍然是一个完整的访问权包。

两种策略的差异不只在价格。OpenAI 的模式把壁垒设在订阅费上：付得起 200 美元月费，就能用最好的模型。Anthropic 对 Fable 5 的策略把壁垒设在两个地方：费用（API 按量计费）和技术门槛（需要 API 接入能力）。Hacker News 上的用户讨论中，有人将这种策略称为“药物免费样品策略，让你上瘾后涨价”，也有人认为这更可能是真实的算力供应链问题，Anthropic 暂时无法以固定价格的订阅模式覆盖 Fable 5 的推理成本。

无论动机如何，效果是清晰的：订阅变成了一张“入场券”，而不是“全通票”。最顶级的模型能力不在票面范围之内。TechCrunch 在关于 Fable 5 发布的报道中指出，Fable 5 是“首个公开发布的 Mythos 级别模型”。在 Fable 5 之前，Mythos 级别仅限 Project Glasswing 合作伙伴使用。现在门槛降低了，但并没有消失。

绕路的用户

访问权的分层已经产生了可见的用户行为变化。一部分用户开始寻找绕过正规渠道的路径。

一种做法是通过第三方聚合服务调用模型。这些“中转站”以低于官方标价的价格提供 token，来源通常是企业批量采购的闲置额度、不同区域的价差套利或未公开渠道。价格更低，但隐私保护和稳定性没有保障。相关讨论在知乎等平台上持续发酵，用户真正担心的不是“便宜 tok en 能不能用”，而是“数据会经过谁的手”。

另一种做法是转向开源或低价替代模型。有开发者分享教程，展示如何把 DeepSeek 等模型接入各类开发工具，绕开官方定价和验证流程。能力会有损失，隐私风险上升，但成本可控性显著提高。

Hacker News 和 Reddit 上的开发者讨论中，混合使用策略被频繁提及：“默认用便宜的模型，只在关键步骤切换 Fable。”这听起来像是合理的资源优化。如果回顾两三年前关于“AI 民主化”的讨论，彼时的主流叙事是每个人都能平等使用最好的模型。现在，“用最好的模型”变成了一件需要精打细算的事。

本地部署提供了另一种对照。一块能够流畅运行大模型的 GPU 价格不低，能跑 120B 模型的整机配备更不是大多数个人开发者可以轻松承担的。本地部署的门槛是另一种形式的付费墙，只是用硬件采购替换了按量计费。

这些绕路行为不是“聪明用户的省钱技巧”。当大量用户开始主动寻找替代方案，是因为原有路径正在变窄。中转站的隐私风险、开源模型的能力差距、本地部署的硬件投入，每一种绕路都有代价。

台阶已经在脚下

如果把 AI 比作水电一类的公用基础设施，那么公用事业的第一原则是普遍服务、公平接入。但 AI 模型的定价趋势正在朝相反的方向走。能力越强价格越高，顶级模型脱离普惠订阅，按 token 计费让成本变得不可预测。水电供应不会只给付费更多的用户提供“更强电流”，但 AI 正在这么做。

这不是一个“贵还是便宜”的定价讨论。当 Claude Fable 这样的顶尖模型被从大众化订阅中移除，当 GPT-5.5 Pro 的输出价格达到 Flash 模型的 13 倍，当个人开发者的一天用量能烧掉 82 美元，“用不起”正在从一个价格问题变成一个结构问题。

在使用 AI 工具的领域里，台阶已经清晰可见。最上层是能负担无限 API 调用和专用硬件的企业级用户，中间层是精打细算使用顶级模型的个人开发者，底层是只能用免费或低价模型的普通用户。这道台阶的每一级，不是由技术水平划定的，而是由支付能力和技术接入能力划定的。

Anthropic 6 月 22 日的截止日期只是这条台阶上最新的一级，不是第一级，也不会是最后一级。