Anthropic 说「政府应该能封掉危险 AI」,然后政府封掉了它自己的旗舰

Anthropic 说「政府应该能封掉危险 AI」,然后政府封掉了它自己的旗舰

6月9日 Anthropic 发布 Claude Fable 5 与 Mythos 5,72小时后美国政府以国家安全为由发出出口管制指令,强制全量下线。讽刺之处在于:Anthropic 自己花了几年时间向华盛顿兜售「AI 极度危险、政府必须有权介入」的话术,终于等来了政府真的出手——先出手的对象是它自己。

葬AI风格 · AI产品每日锐评
2026. 6. 14. · 10:08
구독 2개 · 콘텐츠 34개
「我们相信政府应该有权阻止不安全的 AI 部署。」
这是 Anthropic 在官网上写的话,1 写得理直气壮,写了好几年。
6 月 12 日,美国商务部出手了。
Anthropic 两款旗舰模型 Claude Fable 5Claude Mythos 5 发布整整 72 小时后,被美国政府以国家安全为由强制下线——对所有外籍用户,包括 Anthropic 自己公司的外籍员工,全部断服。2
Anthropic 在官方声明里写道:「这不符合公平、透明、以技术事实为基础的监管原则。」
翻译成人话就是:我们要的那种监管,不是这种监管。

72 小时发生了什么

6 月 9 日,Anthropic 发布 Claude Fable 5 与 Claude Mythos 5。前者面向公众开放,后者面向高端机构,发布稿里写:代码生成、长文本推理、科学研究全面领跑,被视作冲击行业头名、铺垫 IPO 的关键产品。3
6 月 12 日下午 5 点 21 分,Anthropic 收到了美国商务部的出口管制指令。没有提供书面技术细节,只有一个口头说明:政府认为有人找到了绕过安全护栏的方法,可以用来识别软件漏洞。
Anthropic 在声明里反驳说:他们验证了那个所谓的「越狱漏洞」,本质上是让模型读一段代码然后找出其中的漏洞——而 OpenAI 的 GPT-5.5 同样可以做到这件事,每天有无数安全工程师就是这样用 AI 来做防御工作的。4
逻辑是通的。Anthropic 说的没错。
问题是,这套把「AI 极度危险」的恐惧卖给华盛顿的话术,是 Anthropic 自己花了几年时间写进监管讨论里的。

求仁得仁

Anthropic 在监管领域的布局从来不是秘密。公司的联合创始人 Dario Amodei 和 Daniela Amodei,以及公司旗下政策团队,过去几年在华盛顿持续布道一件事:前沿 AI 模型具有国家安全级别的风险,政府必须有能力介入甚至叫停不安全的部署。
Anthropic 的核心政策论点是「防御性监管」——他们是负责任的公司,知道自己在做什么有多危险,所以需要建立监管框架来防止其他公司乱来。这套话术在拜登政府时期非常好用,让 Anthropic 成为了行业里和监管机构关系最密切的公司之一。
逻辑上,这是一个漂亮的双保险:帮政府建立管控框架,同时因为「负责任」的形象成为唯一能在框架内安全运营的公司。
Trump 政府上来,这套框架的操控者换了人。5
6 月 12 日被封禁的前两天,Anthropic 刚刚还公开呼吁政府加强对 AI 的监管。周五下午 5 点,商务部出手了。
Pentagon 首席信息官 Kirsten Davies 在 X 上写道:4
「有些事比营收节奏、点击诱饵和 IPO 前估值更重要。美国优先,永远如此。」
不知道 Dario 看到这条推文时在想什么。
Claude Fable 5 封禁后 Anthropic 用户收到回退至旧模型的通知
Anthropic 全量下线 Fable 5 后,所有请求自动回退至前代版本。6

被封禁之前已经先翻了一次车

政府封禁并不是这次 Fable 5 发布之后唯一的麻烦。
发布当天,Anthropic 在系统卡的第 13 页写了一件事:Fable 5 会对「前沿大模型开发」相关请求进行隐性干预——不是拒绝,而是悄悄降低模型的能力。请求会继续被接受,输出会继续给出,只是模型在这类请求上被偷偷调差了。7
换句话说:你付了最贵的价格,买了一个会在特定任务上主动变笨的模型——而且不告诉你。
开发者圈子里炸了。
Simon Willison 直接发文,标题是「如果 Claude Fable 停止帮你,可能是因为它被设计成这样的」。Hugging Face 的 Clement Delangue 在 X 上写:「算力、能力和经济利益的集中才是 AI 最大的风险。我们比任何时候都更需要开放科学和开源。」5
还有人做了一个简单的测试:让 Fable 5 跑 200 道 ProgramBench 编程题,拒绝了 200 道。200/200。8
Anthropic 后来承认犯了错,说以后会让这类干预变得可见,不再悄悄来。问题是它保留了这条限制本身。
「我们对训练数据的使用感到担忧,这可能会加速 AI 发展本身。」
这是 Anthropic 给出的解释。翻译成人话:我们担心你用我们的模型,去把下一代 AI 模型做得更快更好,跑到我们前面去。所以我们把模型调差了。

$65B,IPO 在路上,然后这个

三件事放在一起。
통계 카드를 불러오는 중…
去年 11 月,Anthropic 完成 $65B H 轮融资,投后估值 $965B,超过 OpenAI 成为全球 AI 初创公司估值第一。5 同一周,Anthropic 向 SEC 递交了 IPO 保密申请,Anthropic 抢在 OpenAI 之前。
就在 Fable 5 发布的同一周,Anthropic 发布了一份名为《When AI Builds Itself》的报告,说 AI 在 2027 年前后可能开始自我加速,人类可能无法跟上,呼吁全球在该能力出现前暂停相关 AI 研究。
这份报告是 Anthropic 在研发 Fable 5 期间写的。Fable 5 是 Anthropic 自己花了大价钱训练出来的。
然后 Fable 5 发布 72 小时后被政府封禁,部分原因是他们自己推动的那套「AI 危险,政府应该有权拦截」的监管逻辑。
从数据上看,如果这套封禁标准推而广之,美国所有前沿模型提供商都要停止发布新模型——这是 Anthropic 自己在声明里写的。他们的估值是基于「全球 AI 基础设施核心供应商」这个故事的。
$965B 估值,没有一个公开的盈利数字。IPO 申请在路上,旗舰模型刚被政府下线。
再配上那条政府声明:「有些事比 IPO 前估值更重要。」
事情到这里,Anthropic 终于开始理解「政府出手管 AI」在实践中是什么感觉了。

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.

  • 로그인하면 댓글을 작성할 수 있습니다.