mt logoMyToken
ETH Gas
EN

Claude Fable 定价翻倍,顶尖 AI 正在变成奢侈品

Favoritecollect
Shareshare

2026 年 6 月 9 日,Anthropic 发布了 Claude Fable 5,一个专注复杂代码规划与生成的新模型。发布本身并不让人意外,但两条附带信息迅速点燃了开发社区的讨论:Fable 5 的 API 定价是上一代 Opus 4.8 的两倍;6 月 22 日之后,Fable 5 将从 Pro、Max 等订阅计划中移除,用户只能通过 API 调用或 usage credits 访问。

有开发者在 Reddit 上反馈,用 Max 20x 计划跑 Fable 5,每分钟消耗 2% 额度。Hacker News 上一位用户记录了自己一天的用量,Fable 5 的 API token 消耗在额度内就达到了 82.92 美元。能力强,但烧钱也快。

这不仅仅是一个模型的定价问题。当最顶尖的 AI 开始按能力等级分层定价,并且最高一级被移出普惠订阅,一个更棘手的问题浮出水面:最好的模型,谁在用?

两倍价格,以及一个倒计时

Anthropic 官方公告显示,Claude Fable 5 是首个公开发布的 Mythos 级别模型。Mythos 是 Anthropic 内部对最高能力模型的定级,此前仅供 Project Glasswing 合作伙伴使用。Fable 5 相当于 Mythos 5 的“公开发行版”,在精确构建代码结构、理解开发者深层需求等场景中,性能较 Claude Sonnet 有显著提升。

能力附带了直接的成本代价。据 Anthropic 官方定价页数据,Fable 5 API 输入价格为每百万 token 10 美元,输出价格为 50 美元。同为 Anthropic 旗下,Opus 4.8 的对应价格是 5 美元和 25 美元,Sonnet 4.6 是 3 美元和 15 美元。Fable 5 的输出价格是 Sonnet 的 3.3 倍。

访问窗口也有限制。Anthropic 确认,6 月 22 日前 Fable 5 包含在所有订阅计划中;6 月 23 日起,Fable 5 将从订阅计划移除,用户需使用 usage credits 才能调用。官方的表述是“容量允许时将恢复为标准订阅功能”,但没有给出时间表。

宾夕法尼亚大学沃顿商学院教授 Ethan Mollick 在他的博客 oneusefulthing.org 上发表了关于 Fable 5 的深度测评。他写道:“Fable 价格是 Opus 的两倍,token 消耗速度表明生产成本会‘非常高’。”Mollick 长期跟踪 AI 模型能力演进,这句判断指向的并非定价策略本身,而是模型运行的基础设施成本。

token 消耗速度有多快?Reddit 用户反馈,在 Claude Max 20x 计划下使用 Fable 5,每分钟消耗约 2% 的额度。这个计划每月定价 200 美元,按此速率,连续使用不到一小时就会耗尽整月额度。Hacker News 上的开发者 Simon Willison 记录了自己一天的 API 使用情况,额度内消耗达到 82.92 美元。

Fable 5 的定价和访问策略传达了一个信号:下一代模型的能力提升直接反映在价格乘数上。订阅计划的“免费试用期”只够用户建立使用习惯。当截止日期到来,用户面临两个选择:支付更不可控的 API 成本继续使用,或者退回到上一个等级的模型。

从 9 美元到 120 美元的分层

Fable 5 的定价不是孤例。把目前在售的主流模型 API 定价拉出来看,一条陡峭的价格光谱清晰可见。

据 Google 官方定价页,Gemini 3.5 Flash 的付费层输出价格为每百万 token 9 美元。OpenAI 官方定价页显示,GPT-5.4 输出价格为 15 美元,GPT-5.5 为 30 美元,GPT-5.5 Pro 为 120 美元。Anthropic 这边,Sonnet 4.6 输出价 15 美元,Opus 4.8 为 25 美元,Fable 5 为 50 美元。

从 Gemini 3.5 Flash 的 9 美元到 GPT-5.5 Pro 的 120 美元,最大价差超过 13 倍。这不再是简单的“高端 vs 低端”二分。厂商正在主动构建一个三层结构:底层是极低价的入门模型,承担普及和获客功能;中层是中等价位的高性能模型,面向日常开发需求;顶层是昂贵但能力最强的推理模型,目标用户是高频、高价值场景的使用者。

定价分层的背后,是能力等级的显性化。Anthropic 用 Sonnet、Opus、Fable、Mythos 四级划分模型能力,OpenAI 用标准版和 Pro 版区分 GPT-5 系列的不同规格,Google 则用 Flash 和 Pro 区分 Gemini 3 系列的定位。这些等级不再只是内部代号,而是直接映射到价格上。

更值得注意的变化发生在访问权上。在 Anthropic 官方定价页公布的模型列表中,Fable 5 被标注为“6 月 22 日前包含在订阅计划中”,Opus 4.8 和 Sonnet 4.6 则没有类似的时间限制。Anthropic 正在尝试一种新的分层方式:不是按能力高低给不同订阅等级分配不同模型,而是直接将顶级模型从订阅体系中剥离,单独建立 API 调用通道。

账单不可控的焦虑

单看每百万 token 50 美元的定价,放在企业采购场景里不算惊人。Claude Fable 的上下文窗口达 100 万 token,最大输出 12.8 万 token,一次完整的复杂任务可能消耗数万到数十万 token。Fable 5 作为推理模型,“思考更久、生成更多 token”不是设计缺陷,而是能力来源。模型在输出最终答案前会进行多步推理,每步都产生 token 消耗。

问题在于用户无法控制这个消耗量。一位用 Max 20x 计划的开发者每分钟烧掉 2% 额度,Simon Willison 一天消耗 82.92 美元。这些消耗发生在“试用期”内,属于计划内额度。6 月 22 日之后,类似的用量将直接转为 API 账单或 credits 扣减。

Token 作为一种计费单位,其消耗量由模型设计方决定,用户无法控制“用量”。把 AI 调用比作用电,核心矛盾在于用户既不能选择“省电模式”,也不能预测下一次查询会消耗多少“电”。一篇发布于 LinkedIn 的行业讨论文章将这种现象概括为“AI 税”的核心特征:“真正的 AI 税不仅是模型价格,而是不可预测性。”

这种不可预测性对个人开发者的冲击远大于企业。企业可以签订批量协议、设置预算上限、在团队内分摊成本。个人用户面对按量计费的 API,一次较真的调试可能就是整月订阅费。Hacker News 上一位用户评论说,“成本意识路由从锦上添花变成强制要求”。“成本意识路由”指的是在默认任务中使用便宜模型,只在必要时调用昂贵模型。在 Fable 5 之前,这更多是一种优化策略;Fable 5 的价格和消耗速度,让这种策略变成了不做就面临超支的刚性配置。

主流 API 都提供不同模型的调用接口,开发者可以自行设定路由逻辑。但这要求用户具备编程能力、理解模型差异、愿意接受降级模型可能带来的质量损失。每多一层门槛,就多一批人被挡在门外。

两百美元月费也买不到全通票

访问权的分层同样在发生变化。Claude Fable 5 的策略是:6 月 22 日之前,所有付费用户都能用;6 月 22 日之后,即使支付最高 200 美元月费的 Max 20x 用户也不能直接访问,需要通过 usage credits 调用 API。

相比之下,OpenAI 的访问权策略是另一条路径。据 ChatGPT 官方定价页,ChatGPT Pro 提供 100 美元和 200 美元两个层级,均可访问 GPT-5 Pro。更高层的模型能力对应更高层的订阅等级,但订阅本身仍然是一个完整的访问权包。

两种策略的差异不只在价格。OpenAI 的模式把壁垒设在订阅费上:付得起 200 美元月费,就能用最好的模型。Anthropic 对 Fable 5 的策略把壁垒设在两个地方:费用(API 按量计费)和技术门槛(需要 API 接入能力)。Hacker News 上的用户讨论中,有人将这种策略称为“药物免费样品策略,让你上瘾后涨价”,也有人认为这更可能是真实的算力供应链问题,Anthropic 暂时无法以固定价格的订阅模式覆盖 Fable 5 的推理成本。

无论动机如何,效果是清晰的:订阅变成了一张“入场券”,而不是“全通票”。最顶级的模型能力不在票面范围之内。TechCrunch 在关于 Fable 5 发布的报道中指出,Fable 5 是“首个公开发布的 Mythos 级别模型”。在 Fable 5 之前,Mythos 级别仅限 Project Glasswing 合作伙伴使用。现在门槛降低了,但并没有消失。

绕路的用户

访问权的分层已经产生了可见的用户行为变化。一部分用户开始寻找绕过正规渠道的路径。

一种做法是通过第三方聚合服务调用模型。这些“中转站”以低于官方标价的价格提供 token,来源通常是企业批量采购的闲置额度、不同区域的价差套利或未公开渠道。价格更低,但隐私保护和稳定性没有保障。相关讨论在知乎等平台上持续发酵,用户真正担心的不是“便宜 tok en 能不能用”,而是“数据会经过谁的手”。

另一种做法是转向开源或低价替代模型。有开发者分享教程,展示如何把 DeepSeek 等模型接入各类开发工具,绕开官方定价和验证流程。能力会有损失,隐私风险上升,但成本可控性显著提高。

Hacker News 和 Reddit 上的开发者讨论中,混合使用策略被频繁提及:“默认用便宜的模型,只在关键步骤切换 Fable。”这听起来像是合理的资源优化。如果回顾两三年前关于“AI 民主化”的讨论,彼时的主流叙事是每个人都能平等使用最好的模型。现在,“用最好的模型”变成了一件需要精打细算的事。

本地部署提供了另一种对照。一块能够流畅运行大模型的 GPU 价格不低,能跑 120B 模型的整机配备更不是大多数个人开发者可以轻松承担的。本地部署的门槛是另一种形式的付费墙,只是用硬件采购替换了按量计费。

这些绕路行为不是“聪明用户的省钱技巧”。当大量用户开始主动寻找替代方案,是因为原有路径正在变窄。中转站的隐私风险、开源模型的能力差距、本地部署的硬件投入,每一种绕路都有代价。

台阶已经在脚下

如果把 AI 比作水电一类的公用基础设施,那么公用事业的第一原则是普遍服务、公平接入。但 AI 模型的定价趋势正在朝相反的方向走。能力越强价格越高,顶级模型脱离普惠订阅,按 token 计费让成本变得不可预测。水电供应不会只给付费更多的用户提供“更强电流”,但 AI 正在这么做。

这不是一个“贵还是便宜”的定价讨论。当 Claude Fable 这样的顶尖模型被从大众化订阅中移除,当 GPT-5.5 Pro 的输出价格达到 Flash 模型的 13 倍,当个人开发者的一天用量能烧掉 82 美元,“用不起”正在从一个价格问题变成一个结构问题。

在使用 AI 工具的领域里,台阶已经清晰可见。最上层是能负担无限 API 调用和专用硬件的企业级用户,中间层是精打细算使用顶级模型的个人开发者,底层是只能用免费或低价模型的普通用户。这道台阶的每一级,不是由技术水平划定的,而是由支付能力和技术接入能力划定的。

Anthropic 6 月 22 日的截止日期只是这条台阶上最新的一级,不是第一级,也不会是最后一级。

Disclaimer: This article is copyrighted by the original author and does not represent MyToken’s views and positions. If you have any questions regarding content or copyright, please contact us.(www.mytokencap.com)contact
More exciting content is available on
X(https://x.com/MyTokencap)
or join the community to learn more:MyToken-English Telegram Group
https://t.me/mytokenGroup