2026 年 6 月 9 日,Anthropic 正式发布 Claude Fable 5——一款面向公众安全可用的 Mythos 级模型——同时为少数网络防御者与基础设施提供商推出 Claude Mythos 5。Fable 5 的能力超越 Anthropic 此前所有公开发布的模型,在几乎所有测试基准上领先,任务越长、越复杂,其优势越明显。

发布如此强大的模型伴随真实风险。若无防护措施,Fable 5 的网络安全能力可能被滥用并造成严重损害。因此 Anthropic 为公众版本配备安全分类器,部分查询将改由 Claude Opus 4.8 处理。这些防护被保守调校——有时会误拦无害请求,但平均仅在不到 5% 的会话中触发。

Claude Mythos 5 与 Fable 5 使用相同底层权重,但在部分领域解除防护。它最初通过 Project Glasswing 与美国政府合作部署,升级 Claude Mythos Preview。Anthropic 称其为全球网络安全能力最强的模型,并计划通过更广泛的受信访问计划扩大覆盖。

两款模型定价均为每百万输入 Token 10 美元、每百万输出 Token 50 美元——不到 Claude Mythos Preview 价格的一半。

Claude Fable 5 与 Claude Mythos 5 能力评估

Fable 5 与 Mythos 5 的自主工作时长超过以往任何 Claude 模型。Anthropic 重点展示了软件工程、知识工作、视觉、记忆与生命科学研究的突破。

软件工程

Stripe 报告称 Fable 5 将数月工程工作压缩至数天。在 5000 万行 Ruby 代码库中,模型用一天完成全库迁移——人工团队预计需两个多月。在 Cognition 的 FrontierCode 评测中,Fable 5 即使在中等努力度下也位居前沿模型之首,且比过往 Claude 模型更省 Token。

知识工作

在 Hebbia 高级金融推理基准上,Fable 5 领先所有受测模型,在文档推理、图表解读与问题解决上提升显著。IMC 表示 Fable 5 在交易分析评估中几乎全面领先,涵盖事实检索、根因分析与期望值分析。

视觉

Fable 5 在视觉任务上达到新 SOTA:从科学图表提取精确数值、仅凭截图重建 Web 应用源代码。早期 Claude 模型玩《宝可梦 火红》需复杂辅助框架;Fable 5 仅凭原始游戏截图与极简视觉框架即通关。

记忆与长上下文

Fable 5 在数百万 Token 的长任务中保持专注,并借助自写笔记改进输出。在卡牌游戏《杀戮尖塔》中,持久文件记忆对 Fable 5 的性能提升是 Opus 4.8 的三倍;进入最终章节的频率也是三倍。

Anthropic 展示的演示包括:从物理第一性原理推导行星轨道并预测日食的太阳系模拟;自主玩《Factorio》;Fable 5 自建的浏览器 CAD 编辑器设计 3D 打印模型;以及 Fable 5 用代码生成音乐并同步的流体模拟。

药物设计与生命科学

使用 Mythos 5,Anthropic 蛋白质设计专家将药物设计部分流程加速约十倍。一项研究中,Mythos 5 在配备蛋白质设计与生物信息学工具、无人工协助下,匹配或超越熟练操作员,完成选结合位点、运行设计工具、从失败中恢复等科学家常做任务。14 个蛋白靶点中有 9 个产生正在研究的强候选药物。

Mythos 5 是 Anthropic 首个能持续产出新颖、有说服力科学假设的模型。盲测中科学家约 80% 更偏好 Mythos 的分子生物学假设;多项已进入实验验证。一条关于大肠杆菌蛋白的假设被外部实验室独立证实。

Mythos 5 还进行了逾一周高度自主的基因组学研究:整合 138 个动物物种数百万细胞的单细胞数据,训练定制模型识别远缘物种中的同类细胞。在少量人工指导下,该模型超越近期《Science》论文模型,尽管规模小 100 倍。

对齐

Anthropic 自动化对齐评估显示 Mythos 5 的失齐行为(含欺骗与协助滥用)处于低位,与 Opus 4.8 相近。Fable 5 共享同一底层模型,对齐特征预期相似。详见模型系统卡。

Claude Fable 5 早期反馈

Claude Fable 5 是 CursorBench 上的 SOTA 模型,打开了以往模型无法触及的长周期问题类别。

Michael Truell · Cursor CEO 兼联合创始人

Claude Fable 5 对 GitHub 服务的开发者是实质性进步。早期测试中,它在复杂长周期编码任务上展现出超越以往基准的自主性与可靠性。

Mario Rodriguez · GitHub 首席产品官

Claude Fable 5 的推理明显超越 Opus 4.8,达到高级研究科学家水准——选方向、分配资源、修正错误信念并产出新颖第一性原理结果。

Sean Ward · IMC CEO 兼联合创始人

Claude Fable 5 首个在我们核心分析基准上突破 90%——比 Opus 高 10 个百分点。

Izzy Miller · Hebbia AI 研究负责人

Claude Fable 5 是我们测试过的前沿物理研究最强模型,推理 Token 仅约三分之一。

Matthew Pines · Epoch AI CEO

Claude Fable 5 在各努力度下均击败 Opus 4.8 的日常电子表格套件,轮次更少,完成速度快 25–30%。

Peter Wang · Anaconda 首席科学官

Claude Fable 5 的新安全机制

Mythos 级模型存在显著滥用风险。自 4 月起 Anthropic 通过 Project Glasswing 向有限网络防御者提供 Claude Mythos Preview。数月改进后,防护已足够稳健以支持公开发布——但仍偏保守,存在已知误报,Anthropic 计划在发布后持续优化。

安全分类器

Fable 5 配备新分类器:独立 AI 系统检测滥用与越狱尝试。当网络安全、生物化学或模型蒸馏相关请求被标记时,改由 Claude Opus 4.8 响应,用户会收到通知。超过 95% 的 Fable 会话不会发生回退。

网络安全:Mythos 级模型擅长发现与利用漏洞及智能体黑客行为。Anthropic 大量红队测试;外部漏洞赏金 1000+ 小时未发现通用越狱。一合作伙伴测试显示 Fable 5 对有害单轮网络攻击请求零配合,含 30 种公开越狱技巧。

生物化学:分类器目前对大多数生物化学请求回退 Opus 4.8——范围偏广但为安全首发。Mythos 5 在未发表 AAV 外壳组装预测任务上超越专用蛋白质语言模型,体现两用科学能力。计划推出 Mythos 5 生物受信访问计划。

蒸馏:被标记为大规模能力提取(Anthropic 观察到来自威权国家的行为)的请求同样回退 Opus 4.8。

新数据保留政策

Fable 5、Mythos 5 及未来同级模型:Anthropic 对 Mythos 级模型全部流量(含第一方与第三方)要求 30 天保留。数据不用于训练新 Claude 模型或非安全用途;人工访问有日志,几乎均在 30 天后删除,以防御新型越狱并减少误报。

Claude Mythos 5 与受信访问计划

拥有 Mythos Preview 的 Glasswing 合作伙伴今日可升级 Mythos 5——与 Fable 5 同模型、解除网络防护,多数场景不弱于 Mythos Preview且成本大幅降低。Anthropic 计划与美国政府协商扩大访问,包括网络安全组织的系统化申请流程。

生物受信访问计划将向少量生命科学研究人员提供解除生物化学防护的 Fable 5(网络防护仍保留),并随分类器改进逐步扩大。

可用性与定价

Claude Fable 5 今日全球可用,通过 Claude API(claude-fable-5)、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry。Claude Mythos 5 仍限于 Glasswing 合作伙伴及即将加入的生物学研究人员,直至更广泛受信访问开放。

  • API 与按量 Enterprise:发布日起 Fable 5 全面可用。
  • 2026 年 6 月 9–22 日:Pro、Max、Team 及席位制 Enterprise 计划免费包含 Fable 5。
  • 6 月 23 日起:上述订阅移除 Fable 5,继续使用需用量积分(容量允许时可能延长免费窗口)。
  • Anthropic 目标在容量充足后将 Fable 5 恢复为订阅标准包含项。

因计算需求更高,Fable 5 在订阅计划中按 2 倍用量计算。Anthropic 将提前沟通 rollout 变更。

命名说明

Mythos 级模型能力高于 Opus。Fable 源自拉丁语 fabula(「被讲述之物」),与希腊 mythos 同源。区分 Fable 5 与 Mythos 5 的是防护机制,而非模型权重。