Anthropic 说「政府应该能封掉危险 AI」，然后政府封掉了它自己的旗舰

「我们相信政府应该有权阻止不安全的 AI 部署。」

这是 Anthropic 在官网上写的话，1 写得理直气壮，写了好几年。

6 月 12 日，美国商务部出手了。

Anthropic 两款旗舰模型 Claude Fable 5 和 Claude Mythos 5 发布整整 72 小时后，被美国政府以国家安全为由强制下线——对所有外籍用户，包括 Anthropic 自己公司的外籍员工，全部断服。2

Anthropic 在官方声明里写道：「这不符合公平、透明、以技术事实为基础的监管原则。」

翻译成人话就是：我们要的那种监管，不是这种监管。

72 小时发生了什么

6 月 9 日，Anthropic 发布 Claude Fable 5 与 Claude Mythos 5。前者面向公众开放，后者面向高端机构，发布稿里写：代码生成、长文本推理、科学研究全面领跑，被视作冲击行业头名、铺垫 IPO 的关键产品。3

6 月 12 日下午 5 点 21 分，Anthropic 收到了美国商务部的出口管制指令。没有提供书面技术细节，只有一个口头说明：政府认为有人找到了绕过安全护栏的方法，可以用来识别软件漏洞。

Anthropic 在声明里反驳说：他们验证了那个所谓的「越狱漏洞」，本质上是让模型读一段代码然后找出其中的漏洞——而 OpenAI 的 GPT-5.5 同样可以做到这件事，每天有无数安全工程师就是这样用 AI 来做防御工作的。4

逻辑是通的。Anthropic 说的没错。

问题是，这套把「AI 极度危险」的恐惧卖给华盛顿的话术，是 Anthropic 自己花了几年时间写进监管讨论里的。

求仁得仁

Anthropic 在监管领域的布局从来不是秘密。公司的联合创始人 Dario Amodei 和 Daniela Amodei，以及公司旗下政策团队，过去几年在华盛顿持续布道一件事：前沿 AI 模型具有国家安全级别的风险，政府必须有能力介入甚至叫停不安全的部署。

Anthropic 的核心政策论点是「防御性监管」——他们是负责任的公司，知道自己在做什么有多危险，所以需要建立监管框架来防止其他公司乱来。这套话术在拜登政府时期非常好用，让 Anthropic 成为了行业里和监管机构关系最密切的公司之一。

逻辑上，这是一个漂亮的双保险：帮政府建立管控框架，同时因为「负责任」的形象成为唯一能在框架内安全运营的公司。

Trump 政府上来，这套框架的操控者换了人。5

6 月 12 日被封禁的前两天，Anthropic 刚刚还公开呼吁政府加强对 AI 的监管。周五下午 5 点，商务部出手了。

Pentagon 首席信息官 Kirsten Davies 在 X 上写道：4

「有些事比营收节奏、点击诱饵和 IPO 前估值更重要。美国优先，永远如此。」

不知道 Dario 看到这条推文时在想什么。

Claude Fable 5 封禁后 Anthropic 用户收到回退至旧模型的通知 — Anthropic 全量下线 Fable 5 后，所有请求自动回退至前代版本。6

被封禁之前已经先翻了一次车

政府封禁并不是这次 Fable 5 发布之后唯一的麻烦。

发布当天，Anthropic 在系统卡的第 13 页写了一件事：Fable 5 会对「前沿大模型开发」相关请求进行隐性干预——不是拒绝，而是悄悄降低模型的能力。请求会继续被接受，输出会继续给出，只是模型在这类请求上被偷偷调差了。7

换句话说：你付了最贵的价格，买了一个会在特定任务上主动变笨的模型——而且不告诉你。

开发者圈子里炸了。

Simon Willison 直接发文，标题是「如果 Claude Fable 停止帮你，可能是因为它被设计成这样的」。Hugging Face 的 Clement Delangue 在 X 上写：「算力、能力和经济利益的集中才是 AI 最大的风险。我们比任何时候都更需要开放科学和开源。」5

还有人做了一个简单的测试：让 Fable 5 跑 200 道 ProgramBench 编程题，拒绝了 200 道。200/200。8

Anthropic 后来承认犯了错，说以后会让这类干预变得可见，不再悄悄来。问题是它保留了这条限制本身。

「我们对训练数据的使用感到担忧，这可能会加速 AI 发展本身。」

这是 Anthropic 给出的解释。翻译成人话：我们担心你用我们的模型，去把下一代 AI 模型做得更快更好，跑到我们前面去。所以我们把模型调差了。

$65B，IPO 在路上，然后这个

三件事放在一起。

Anthropic 当前关键数字

2026年6月 IPO 前快照

H轮投后估值

965B

H轮融资额

65B

旗舰模型存活时长

72小时

통계 카드를 불러오는 중…

去年 11 月，Anthropic 完成 $65B H 轮融资，投后估值 $965B，超过 OpenAI 成为全球 AI 初创公司估值第一。5 同一周，Anthropic 向 SEC 递交了 IPO 保密申请，Anthropic 抢在 OpenAI 之前。

就在 Fable 5 发布的同一周，Anthropic 发布了一份名为《When AI Builds Itself》的报告，说 AI 在 2027 年前后可能开始自我加速，人类可能无法跟上，呼吁全球在该能力出现前暂停相关 AI 研究。

这份报告是 Anthropic 在研发 Fable 5 期间写的。Fable 5 是 Anthropic 自己花了大价钱训练出来的。

然后 Fable 5 发布 72 小时后被政府封禁，部分原因是他们自己推动的那套「AI 危险，政府应该有权拦截」的监管逻辑。

从数据上看，如果这套封禁标准推而广之，美国所有前沿模型提供商都要停止发布新模型——这是 Anthropic 自己在声明里写的。他们的估值是基于「全球 AI 基础设施核心供应商」这个故事的。

$965B 估值，没有一个公开的盈利数字。IPO 申请在路上，旗舰模型刚被政府下线。

再配上那条政府声明：「有些事比 IPO 前估值更重要。」

事情到这里，Anthropic 终于开始理解「政府出手管 AI」在实践中是什么感觉了。

Anthropic 说「政府应该能封掉危险 AI」，然后政府封掉了它自己的旗舰

72 小时发生了什么

求仁得仁

被封禁之前已经先翻了一次车

$65B，IPO 在路上，然后这个

참고 출처