发布日期:2026-06-10 | 话题:Claude Fable 5 / Claude Opus 4.8 / 模型对比 / API 选型 / 大模型

Claude Fable 5(2026-06-09 发布)和 Claude Opus 4.8(2026-05-28 发布)是 Anthropic 当前面向普通用户和开发者的两款最强主力模型。Fable 5 是 Mythos 级底座,SWE-Bench Pro 得分 80.3%,比 Opus 4.8 的 69.2% 高出 11 个百分点,在几乎所有能力维度上全面领先;Opus 4.8 定价是 Fable 5 的一半(API 输入 $5/M vs $10/M),Fast Mode 还能以 2.5 倍速度运行,性价比极高。两者适用场景明确:任务越复杂、越长、越需要自主决策,Fable 5 的优势越大;预算受限或高并发场景,Opus 4.8 是更务实的选择(来源:Anthropic 官网,2026-06)。


一张表看清核心差异

维度Claude Fable 5Claude Opus 4.8
发布时间2026-06-092026-05-28
能力层级Mythos 级(最高级)Opus 级
SWE-Bench Pro80.3%69.2%
FrontierCode Diamond29.3%
Online-Mind2Web(浏览器 Agent)84%
API 输入定价$10 / M tokens$5 / M tokens
API 输出定价$50 / M tokens$25 / M tokens
Prompt Cache 读取$1 / M tokens$0.50 / M tokens
Fast Mode未提供2.5× 速,2× 标准价
安全分类器内置(触发降级至 Opus 4.8)
订阅免费体验Pro/Max/Team,6月22日前已全面开放
数据来源:Anthropic 官方 API 定价页 + 发布公告,2026-06

能力对比:Fable 5 领先幅度有多大

软件工程与代码

Fable 5 在代码领域的领先是本次发布中最显眼的——SWE-Bench Pro 80.3% 对 Opus 4.8 的 69.2%,差距达 11 个百分点(来源:Anthropic 官网,2026-06)。

更关键的是 任务复杂度带来的倍增效应

  • Cognition FrontierCode Diamond(高标准生产代码质量评测):Fable 5 得 29.3%,且在中等算力档位就到达峰值,不需要拉满思考预算
  • CursorBench:Fable 5 是当前最高分,"开辟了 Opus 4.8 力所不及的长期任务类别"(来源:Cursor CEO Michael Truell,Anthropic 官网,2026-06)
  • ViBench(端到端 Vibe Coding 基准):Fable 5 是最高分,"几乎饱和基础用例,且用更少 token 更快完成"
  • Stripe 真实案例:Fable 5 在 5000 万行 Ruby 代码库中完成全局迁移,仅用一天,同等工作正常需要整个团队两个多月

Opus 4.8 在代码领域同样很强——CursorBench 上"超越所有先前 Opus 模型",工具调用效率更高,是主力日常编程助手的好选择。但面对跨文件、长上下文、多步骤 Agent 任务,Fable 5 的差距会明显拉大。

长任务 Agent 与自主运行

Fable 5 在自主长任务上的进步是比基准分数更重要的质变(来源:Anthropic 官网,2026-06):

  • 文件记忆增益:同样给予持久化文件记忆,Fable 5 在《杀戮尖塔》游戏测试中性能提升是 Opus 4.8 的 3 倍,到达最终关卡频率同样是 3 倍——说明 Fable 5 更善于从自己的经验中学习
  • Devin(Cognition):Fable 5 工具调用更简洁,遵循指令一致性更高,"直接转化为更快的能力提升"
  • 自主性更强:AutomationBench 上 Fable 5 持续高于 Opus 4.8,且"更自主,Opus 倾向于停下来询问,Fable 5 会继续探索"

Opus 4.8 的 Agent 判断力也很出色——Super-Agent Benchmark 上是"唯一完成每个案例端到端的模型",且"成本与 GPT-5.5 持平"。

视觉理解

Fable 5 是目前 Anthropic 视觉能力最强的模型(来源:Anthropic 官网,2026-06):

  • 仅靠游戏截图通关宝可梦火红全流程(Opus 系列需要复杂辅助工具才能推进)
  • 能从截图完整重建 Web App 源代码
  • 能从复杂科学图表中提取精确数值

Opus 4.8 的多模态能力同样强,支持 PDF、图表、非结构化内容推理,Databricks 测试"61% 更低 token 成本"。但需要精确视觉内容提取或以图生代码的场景,Fable 5 更可靠。

诚实度与对齐

Opus 4.8 有一项特别亮点:诚实度大幅提升,约四倍不易让代码缺陷悄悄通过,更倾向主动标注不确定性(来源:Anthropic 官网,2026-06)。对法律、金融等高严谨性场景,这一点极为重要——CoCounsel 法律基准上 Opus 4.8 是首个突破 10% 全通过标准的模型。


定价与成本:两倍差距意味着什么

Fable 5 的 API 定价恰好是 Opus 4.8 的两倍(来源:Anthropic API 定价页,2026-06):

费用项Fable 5Opus 4.8
输入$10 / M tokens$5 / M tokens
输出$50 / M tokens$25 / M tokens
Cache 写入$12.50 / M tokens$6.25 / M tokens
Cache 读取$1 / M tokens$0.50 / M tokens
Fast Mode2× 标准价(2.5× 速)
Batch 折扣均支持,节省 50%均支持,节省 50%

Opus 4.8 Fast Mode 是一个重要变量:以 2× 价格换取 2.5× 速度,适合高并发、低延迟场景,且 Fast Mode 成本比上代模型低了三倍,是 Fable 5 目前没有提供的优势。

成本决策的核心逻辑:如果 Fable 5 完成同一任务所需的 token 数更少(因为更聪明不需要多轮纠偏),两者的实际成本差距会小于账面的 2 倍;如果任务简单、Opus 4.8 一次通过,则 Fable 5 只是在多花钱。


谁适合用哪个:场景决策框架

任务特征分析
│
├── 任务规模:多文件 / 跨系统 / 长达数小时
│   └── → Fable 5(长任务自主能力跨越级提升)
│
├── 视觉密集型:以图生代码 / 截图复现 / 科学图表解析
│   └── → Fable 5(视觉理解显著领先)
│
├── 代码质量要求极高:生产级 PR / 复杂 Agent 工作流
│   └── → Fable 5(FrontierCode Diamond 5 倍领先)
│
├── 高频日常编程:调试 / 代码补全 / 文档生成
│   ├── 预算充足 → Fable 5
│   └── 控制成本 → Opus 4.8(性价比更高)
│
├── 高并发 / 低延迟场景
│   └── → Opus 4.8 Fast Mode(2.5× 速 + 更低成本)
│
├── 法律 / 金融 / 严谨知识工作(诚实度要求高)
│   └── → Opus 4.8 或 Fable 5 均可(Opus 4.8 诚实度有专项优化)
│
├── 网络安全 / 生化相关任务
│   └── → Opus 4.8(Fable 5 在此类任务会触发降级至 Opus 4.8)
│
└── 预算敏感 / 测试阶段
    └── → Opus 4.8(相同 Claude Code 订阅,6 月 22 日前免费试 Fable 5)

安全分类器:Fable 5 特有的"隐形限制"

Fable 5 内置了安全分类器,这是 Opus 4.8 没有的机制(来源:Anthropic 官网,2026-06):

  • 触发后行为:系统自动将该请求降级至 Opus 4.8 回复,用户不会被特别提示
  • 触发率:平均低于 5% 的会话;网络安全、生物化学、模型蒸馏等领域更容易触发
  • 蒸馏防护特殊处理:尝试蒸馏 Fable 5 不会触发降级通知,而是通过提示词修改、控制向量和 PEET 技术直接限制模型能力,约 0.03% 流量受影响

实际影响:对大部分开发者而言,日常编程、写作、分析任务不会触发;如果业务涉及安全工具开发、红队测试或相关领域研究,Opus 4.8 反而是更稳定的选择,不会出现意外降级。


Opus 4.8 的独特优势:不止"便宜版 Fable 5"

虽然 Fable 5 在大多数基准上领先,但 Opus 4.8 有几项专属优势值得重视(来源:Anthropic 官网,2026-06):

Fast Mode:2.5× 速度,成本仅为标准 Opus 4.8 的 2×,是 Fable 5 目前没有的选项,高并发场景的成本优势明显。

诚实度升级:Opus 4.8 专门优化了"不过度自信"——代码缺陷通过率降低 4 倍,主动标注不确定性,对法律、合规、医疗等高严谨性场景有重要价值。

浏览器 Agent:Online-Mind2Web 84%,"是测过的最强计算机使用和浏览器 Agent 模型"(来源:Anthropic 合作方反馈)。Fable 5 在此项没有公开数据,但按能力层级推断应当更强——若有实际需求,等用户反馈数据积累后再切换。

Claude Code 动态工作流:Opus 4.8 发布时同步推出,允许单次会话运行数百个并行子 Agent,专为大规模代码库迁移设计——而 Fable 5 在此之上进一步强化了 Agent 的自主性。


实际迁移建议:从 Opus 4.8 切换到 Fable 5

如果你目前在用 Opus 4.8,以下是切换 Fable 5 的参考路径(来源:Anthropic API 定价页,2026-06):

API 侧:Model ID 从 claude-opus-4-8 改为 claude-fable-5,其余 SDK 代码零改动。Prompt Cache 读取成本翻倍($0.50 → $1/M),评估是否要调整 cache 策略。

成本预估:如果你月均 Opus 4.8 API 花费 $100,同等请求量切 Fable 5 账面成本约 $200。实际成本取决于 Fable 5 能否用更少 token 完成同等任务——复杂任务中 token 效率提升可能抵消一部分涨幅。

灰度策略:长任务/复杂 Agent 工作流切 Fable 5,高频简单请求(补全、问答、摘要)留 Opus 4.8,是平衡效果与成本的常见做法。

订阅用户:2026 年 6 月 22 日前 Pro/Max/Team 用户可以免费试用 Fable 5,这是零成本验证迁移效果的窗口期。

对于需要同时管理 Anthropic 模型和其他厂商模型 API 的团队,七牛云 AI 推理服务兼容 OpenAI 和 Anthropic 双 SDK 格式,切换 base_url 即可统一路由,新模型跟进后无需重写鉴权代码。


FAQ

Q:Fable 5 的 SWE-Bench Pro 比 Opus 4.8 高 11 个点,日常写代码感受得到差距吗?

短 prompt 的简单任务(写函数、修单个 bug)差距不明显;差距在长任务中显现——多文件重构、需要 Agent 自主决策的代码迁移、或者需要从上下文推断架构意图的任务。Cursor CEO 的描述是"开辟了 Opus 4.8 力所不及的长期任务类别",这是定性的感知描述,不是每道题都有差异(来源:Anthropic 官网,2026-06)。

Q:Opus 4.8 Fast Mode 和 Fable 5 标准速度哪个更快?

官方未提供直接对比数据。Opus 4.8 Fast Mode 是 Opus 4.8 标准速度的 2.5 倍,Fable 5 的基础速度接近 Opus 4.8 标准。粗略估计 Opus 4.8 Fast Mode 延迟低于 Fable 5,且成本约为 Fable 5 的一半——对延迟敏感的高并发场景,Fast Mode 优势明显(来源:Anthropic API 定价页,2026-06)。

Q:6 月 22 日之后,Pro 订阅还能用 Fable 5 吗?

能,但需要消耗 credits(Pro 月度 credits 额度有限)。Free 计划不包含 Fable 5。定价页显示 Fable 5 属于"Promo"状态,22 日后具体 credit 消耗比例以 Anthropic 届时公告为准(来源:Anthropic 定价页,2026-06)。

Q:Fable 5 在安全任务中降级到 Opus 4.8,那我对 Fable 5 的调用会被按 Opus 4.8 收费吗?

Anthropic 官方未明确说明降级计费规则。从逻辑上推断,降级回复由 Opus 4.8 生成,但用户发起的是 Fable 5 请求——建议在上线前向 Anthropic 确认计费细节,避免超预期支出(来源:Anthropic 官网,2026-06)。

Q:两个模型的对齐安全性哪个更好?

Anthropic 的自动化对齐评估显示:Fable 5 / Mythos 5 的误对齐行为水平"低且与 Opus 4.8 相似"——两者是同底座模型,Fable 5 加了安全分类器,但底层对齐程度接近(来源:Anthropic 官网,2026-06)。Opus 4.8 的亲社会特质(支持用户自主性、符合用户利益)达到 Anthropic 当前最高水平。


总结

Fable 5 和 Opus 4.8 的选择不是"新 vs 旧",而是"更强 vs 更省"。复杂 Agent 任务、长上下文、视觉密集型场景——选 Fable 5高频日常任务、高并发、预算优先、网络安全相关需求——Opus 4.8。6 月 22 日前是免费窗口期,建议用自己的真实业务数据跑一批对比评估,再做是否全量迁移的决定。两者定价均来自 Anthropic 官方 API 定价页(2026-06),随时可能调整,以控制台实时显示为准。


参考资料


七牛云行业应用
10 声望10 粉丝