2026-06-12 04:39:25 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： AnthropicCEODarioAmodei于2026年6月11日公开呼吁美国政府实施强制性AI监管，提出三大主张：强制第三方安全测试、赋予政府阻止高风险AI模型部署的权力、反对限制州立法权。文章以霍比特人与树人隐喻揭示AI发展速度远超政策跟进，并结合Anthropic同期发布的ClaudeFable5与Mythos5模型案例，说明通过分层安全护栏平衡能力释放与风险控制的策略。最后指出当前AI代码自主生成带来的安全审计挑战，强调需政府介入监管。 综合评分： 85 文章分类： AI安全,政策法规,漏洞分析,解决方案,安全建设

cover_image

AnthropicCEO：有权阻止AI模型

原创

ladon ladon

306Safe

2026年6月11日 09:47 北京

在小说阅读器读本章

去阅读

6月11日，AI安全领域扔下一枚重磅炸弹——Anthropic CEO Dario Amodei发表长文《人工智能指数政策》，公开呼吁美国政府实施强制性AI监管，赋予政府阻止高风险AI模型部署的权力。

一、Anthropic CEO的核心主张

Amodei在文中提出了三大核心主张：

1. 强制第三方安全测试：AI模型在部署前必须接受独立的第三方测试，评估其在网络安全威胁、生物武器制造等多个风险维度的潜在危害。

2. 政府干预权：如果AI被认定为”构成不可接受的风险”，政府应有权阻止或限制其部署。

3. 反对限制州立法权：Anthropic呼吁国会不要阻止各州制定自己的AI监管法规，除非联邦层面能通过一项应对”灾难性AI风险”的严格法律。

这三大主张直接与特朗普政府的”自愿合规”路线形成鲜明对立。特朗普此前敦促国会以联邦法规替代各州的AI监管规则，推动AI行业”松绑”。

二、”霍比特人与树人”的隐喻

Amodei用《指环王》中的隐喻来形容当前AI发展与政策监管的脱节：霍比特人试图唤醒行动迟缓的树人去保卫森林——就像AI正以闪电般的速度狂飙，而政治体制的行动节奏却远远跟不上。

他给出的数据令人震撼：仅仅四年，AI模型从勉强写出一行连贯代码，进化到能够编写大型AI公司中超过80%的代码。在生物学、物理学、数学、金融学、法学等领域，AI都取得了接近或超越人类专家的表现。

三、”神话”模型同步解禁：安全护栏的平衡术

就在Amodei发表政策长文的前一天（6月10日），Anthropic正式发布了Claude Fable 5和Claude Mythos 5两款模型。这背后的安全设计颇具看点：

同一底座，两副面孔：Fable 5和Mythos 5共享同一个底层模型，能力均属”Mythos级”——Anthropic迄今为止最强的大模型等级。区别全在安全防护上：

Fable 5（寓言）

：面向公众开放，设置了多层安全护栏——网络安全、生物化学、模型蒸馏、前沿AI研发等领域均有不同层级限制。当用户提出高风险请求时，系统会触发安全分类器进行拦截。
Mythos 5（神话）

：仅通过Project Glasswing项目向网络安全防御方和基础设施提供商开放，在敏感双重用途能力上的限制更少，但受众被严格管控。

Anthropic发布的319页系统卡详细披露了这套安全安排。同一代模型能力被拆分成不同可访问版本，Fable 5是”加了保守安全管家”的Mythos 5。这种”降维安全学”成为Anthropic平衡能力释放与风险控制的核心策略。

四、安全视角：AI监管的十字路口

Anthropic的这波操作，本质上是在做一件事：证明AI公司可以既追求技术领先，又主动接受监管约束。

一方面，Anthropic在4月首次推出Mythos级模型时就以”网络安全风险”为由限制开放；两个月后，他们带着”实质性安全护栏”的Fable 5回归公众市场。这是在向监管者展示：安全措施是可行的，但需要制度保障。

另一方面，360安全团队最新监测显示，仅OpenClaw框架就累计披露82个漏洞，高危占比近四成，公网上数百万AI资产处于无防护状态。模型幻觉、框架漏洞与资产暴露三重叠加，传统”只防外部攻击”的防线已然捉襟见肘。

关键问题在于：当AI自主编写80%代码时，谁来审计这些代码的安全性？当模型能力远超监管速度时，自愿合规是否还够用？Anthropic给出的答案是——必须让政府拥有”刹车权”。

这场AI安全与监管的博弈，才刚刚开始。

参考来源：路透社、凤凰网科技、智东西、至顶AI实验室、虎嗅网、360安全团队

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：306Safe ladon ladon《AnthropicCEO：有权阻止AI模型》