文章总结: AnthropicCEODarioAmodei于2026年6月11日公开呼吁美国政府实施强制性AI监管,提出三大主张:强制第三方安全测试、赋予政府阻止高风险AI模型部署的权力、反对限制州立法权。文章以霍比特人与树人隐喻揭示AI发展速度远超政策跟进,并结合Anthropic同期发布的ClaudeFable5与Mythos5模型案例,说明通过分层安全护栏平衡能力释放与风险控制的策略。最后指出当前AI代码自主生成带来的安全审计挑战,强调需政府介入监管。 综合评分: 85 文章分类: AI安全,政策法规,漏洞分析,解决方案,安全建设
AnthropicCEO:有权阻止AI模型
原创
ladon ladon
306Safe
2026年6月11日 09:47 北京
在小说阅读器读本章
去阅读
6月11日,AI安全领域扔下一枚重磅炸弹——Anthropic CEO Dario Amodei发表长文《人工智能指数政策》,公开呼吁美国政府实施强制性AI监管,赋予政府阻止高风险AI模型部署的权力。
一、Anthropic CEO的核心主张
Amodei在文中提出了三大核心主张:
1. 强制第三方安全测试:AI模型在部署前必须接受独立的第三方测试,评估其在网络安全威胁、生物武器制造等多个风险维度的潜在危害。
2. 政府干预权:如果AI被认定为”构成不可接受的风险”,政府应有权阻止或限制其部署。
3. 反对限制州立法权:Anthropic呼吁国会不要阻止各州制定自己的AI监管法规,除非联邦层面能通过一项应对”灾难性AI风险”的严格法律。
这三大主张直接与特朗普政府的”自愿合规”路线形成鲜明对立。特朗普此前敦促国会以联邦法规替代各州的AI监管规则,推动AI行业”松绑”。
二、”霍比特人与树人”的隐喻
Amodei用《指环王》中的隐喻来形容当前AI发展与政策监管的脱节:霍比特人试图唤醒行动迟缓的树人去保卫森林——就像AI正以闪电般的速度狂飙,而政治体制的行动节奏却远远跟不上。
他给出的数据令人震撼:仅仅四年,AI模型从勉强写出一行连贯代码,进化到能够编写大型AI公司中超过80%的代码。在生物学、物理学、数学、金融学、法学等领域,AI都取得了接近或超越人类专家的表现。
三、”神话”模型同步解禁:安全护栏的平衡术
就在Amodei发表政策长文的前一天(6月10日),Anthropic正式发布了Claude Fable 5和Claude Mythos 5两款模型。这背后的安全设计颇具看点:
同一底座,两副面孔:Fable 5和Mythos 5共享同一个底层模型,能力均属”Mythos级”——Anthropic迄今为止最强的大模型等级。区别全在安全防护上:
-
Fable 5(寓言)
:面向公众开放,设置了多层安全护栏——网络安全、生物化学、模型蒸馏、前沿AI研发等领域均有不同层级限制。当用户提出高风险请求时,系统会触发安全分类器进行拦截。
-
Mythos 5(神话)
:仅通过Project Glasswing项目向网络安全防御方和基础设施提供商开放,在敏感双重用途能力上的限制更少,但受众被严格管控。
Anthropic发布的319页系统卡详细披露了这套安全安排。同一代模型能力被拆分成不同可访问版本,Fable 5是”加了保守安全管家”的Mythos 5。这种”降维安全学”成为Anthropic平衡能力释放与风险控制的核心策略。
四、安全视角:AI监管的十字路口
Anthropic的这波操作,本质上是在做一件事:证明AI公司可以既追求技术领先,又主动接受监管约束。
一方面,Anthropic在4月首次推出Mythos级模型时就以”网络安全风险”为由限制开放;两个月后,他们带着”实质性安全护栏”的Fable 5回归公众市场。这是在向监管者展示:安全措施是可行的,但需要制度保障。
另一方面,360安全团队最新监测显示,仅OpenClaw框架就累计披露82个漏洞,高危占比近四成,公网上数百万AI资产处于无防护状态。模型幻觉、框架漏洞与资产暴露三重叠加,传统”只防外部攻击”的防线已然捉襟见肘。
关键问题在于:当AI自主编写80%代码时,谁来审计这些代码的安全性?当模型能力远超监管速度时,自愿合规是否还够用?Anthropic给出的答案是——必须让政府拥有”刹车权”。
这场AI安全与监管的博弈,才刚刚开始。
参考来源:路透社、凤凰网科技、智东西、至顶AI实验室、虎嗅网、360安全团队
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:306Safe ladon ladon《AnthropicCEO:有权阻止AI模型》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。











评论