文章总结: Anthropic公司开发的Mythos人工智能在授权红队测试中展现出突破性网络安全能力,数小时内攻破NSA多数机密系统,发现OpenBSD存在27年的漏洞。该模型在CTF挑战中达73%通过率,能完成32步企业网络入侵模拟。美国政府因此紧急全球禁用该产品,引发技术管控与盟友合作争议。文档还揭示Mythos具备递归自我改进早期迹象,其训练代码优化能力达52倍提升。 综合评分: 87 文章分类: 漏洞分析,AI安全,政策法规,威胁情报,网络安全
Anthropico 公司的 Mythos 人工智能在数小时内几乎攻破了所有美国国家安全局的机密系统
文刀 文刀
情报分析师
2026年6月23日 11:28 辽宁
在小说阅读器读本章
去阅读
6月11日,华盛顿,参议院情报委员会。
副主席马克·沃纳参议员当着委员会的面说了一句话,在场所有人都安静了。他转述的,是美国国家安全局局长、同时领导五角大楼网络司令部的约书亚·鲁德将军亲口告诉他的内容:
“这个工具攻破了我们几乎所有的机密系统,不是在几周内,而是在几小时内。”
他说的”这个工具”,是一个叫Mythos的人工智能模型,开发商是位于旧金山的Anthropic公司。
那是6月11日。第二天,6月12日下午5点21分,Anthropic收到了美国商务部的一封信。信里的措辞没有任何模糊地带:立刻禁止所有外国人访问Fable 5和Mythos 5,包括Anthropic公司内部的外籍员工。
由于在实际操作中无法做到实时核验每一位用户的国籍,Anthropic只有一个选择——对全球所有用户一刀切关闭,包括盟友,包括欧洲,包括英国、澳大利亚、加拿大、新西兰这些五眼情报伙伴。没有任何提前警告。
这是美国政府有史以来第一次,强制关闭一个已经公开发布的商业AI产品。
距离Fable 5发布,仅仅过了72小时。
先搞清楚Mythos到底是什么
2026年4月,Anthropic正式公布了Mythos,并同时启动了一个叫”玻璃翼计划”(Project Glasswing)的项目,向精心筛选的合作伙伴开放访问权限。
最初的合作伙伴大约50家,名单里有亚马逊云、苹果、谷歌、微软、英伟达、帕洛阿尔托网络、CrowdStrike、思科、摩根大通和Linux基金会等。到了6月初,合作伙伴扩展到约200家,覆盖15个国家。
这个安排本身就说明了问题。
Anthropic不是不想公开Mythos,而是认为这个模型太过危险,不能直接面向公众,所以才设计了这种受控访问的分发方式。
那为什么说危险?看数字。
在Mythos问世之前,Anthropic之前的旗舰模型Claude Opus 4.6,在一个针对Firefox浏览器引擎的安全漏洞挖掘基准测试中,找到了2个可用漏洞。
Mythos Preview,在同一个测试里,找到了181个。
不是翻了几倍,是翻了将近90倍。
英国人工智能安全研究所(UK AISI)独立评测的结论是:Mythos是迄今为止第一个能够独立完成一套32步骤企业网络入侵模拟全流程的AI模型——而且一共尝试10次,其中3次完整完成,平均完成22个步骤。在专家级”夺旗赛”(CTF)挑战中,Mythos的通过率达到73%。
英国AI安全研究所用的是它们自己的独立评测体系,不依赖Anthropic的内部数据,所以这个数字可以交叉验证。
还有一件事专门值得一提。
在Project Glasswing启动后的一个月内,Mythos Preview在合作伙伴的系统中共发现了超过1万个高危或严重漏洞。
其中有一个发现尤其刺眼——OpenBSD操作系统中一个存在了27年的漏洞。
OpenBSD是公认的业界安全性最高的操作系统之一,大量防火墙和路由器都在用它,它的设计理念就是”安全优先”,代码库被反复审计了几十年。
Mythos找到了一个隐藏在TCP网络栈SACK处理逻辑里的状态机错误,这个错误可以让攻击者远程执行任意代码,只需要两个网络数据包。
这个漏洞从1998年就存在了,没有任何人类安全研究员在此前将近三十年的审计中发现它。
Anthropic估算,发现这个漏洞的单次模型运行成本不到50美元。
这就是Mythos的基本轮廓:能够从海量代码中自主识别人类几十年都没发现的深层逻辑缺陷,能够将多个单独的漏洞串联成完整的攻击链,能够对已编译的二进制代码进行分析(不需要源代码),还能独立完成从侦察到提权的整套攻击流程。
72小时:一部政治惊悚片的真实版
6月9日:Anthropic发布Claude Fable 5,这是Mythos技术的消费者版本,加装了专门的安全护栏,将网络安全和生物领域的危险查询路由到较保守的Opus 4.8模型处理。同日,Mythos 5向已获批的Project Glasswing合作伙伴推送升级。
有意思的一个背景:就在发布前5天,6月4日,Anthropic刚刚发表了一篇内部研究报告,公开讨论递归自我改进(RSI)的早期迹象,并明确呼吁对前沿AI发展实施全球协调控制。发表完论文,5天后发布了有史以来最强大的公开AI产品。这个矛盾,Anthropic自己也没有给出很好的解释。
6月11日:这是关键的一天。两件事情并行发生。
一方面,参议院情报委员会举行听证,NSA局长约书亚·鲁德将军向参议员沃纳汇报了一次授权红队测试的结果——Mythos在短短几小时内突破了NSA管辖的几乎所有机密系统。
另一方面,据报道,亚马逊的安全团队在内部测试中发现了Fable 5的一个越狱方法,亚马逊CEO安迪·贾西尝试直接联系Anthropic CEO达里奥·阿莫迪但未能接通,随后贾西直接打电话给美国政府高级官员,汇报了这一发现。
亚马逊既是Anthropic的最大投资方,也是触发这次关闭行动的直接推手。
6月12日,下午5点21分:商务部长霍华德·卢特尼克签署的信函送达Anthropic,要求立即停止所有外籍人士访问Fable 5和Mythos 5。Anthropic被给予约90分钟的合规窗口期。
Anthropic认为,这个越狱的性质被严重高估了——它本质上只是让模型读取代码并修复漏洞,同样的操作在OpenAI的GPT-5.5上也能复现,算不上针对Fable 5专有的重大安全漏洞。
公司CEO达里奥·阿莫迪随后亲赴华盛顿进行斡旋。
由于无法实时核验每位用户国籍,Anthropic选择了对所有人关闭。
结果是英国、加拿大、澳大利亚、新西兰这四个五眼联盟核心成员全部断网,而英国AI安全研究所——这个专门负责对前沿AI模型进行独立安全评估的机构,此刻正在积极评估Mythos 5——被直接锁在门外。
《经济学人》把这件事形容为”反复无常且混乱”。
那个”几小时攻破NSA”的说法,到底真实程度几何
这是整件事里最需要区分”事实”和”叙事”的地方。
沃纳参议员说的,是鲁德将军”告诉他”的话。
这是一手的政治证词,不是一份公开的技术报告。沃纳引述这句话时,语境是在呼吁加快对前沿AI的监管测试,而不是在谴责Anthropic或Mythos。
《经济学人》负责报道这则新闻的编辑尚克·约希,在文章发出后自己在社交媒体上补充说明:这段话”不应该被字面理解”,它依赖于Mythos在特定条件下与其他工具配合使用的结果,不代表模型单独行动的能力。
还有一点需要明确:这是一次授权红队测试(authorized red-team exercise),不是黑客入侵。是NSA主动让Mythos来测试自己系统的防御边界,是美国政府自己安排的内部评估,相当于请人来查自己家房子有没有漏洞。
也有来自行业的反驳声音。比特币托管公司BitGo的CEO麦克·贝尔谢就在网上直接说这个说法是假的。
还有分析师指出,红队测试的条件和真实攻击场景之间存在重大差距。
所以,这件事的事实层面应该这样理解:
可以确认的是,NSA安排了一次授权的Mythos红队测试,测试的结果让情报委员会高度警觉,鲁德将军亲自向参议员沃纳作了汇报,汇报内容足以触发立法行动。测试的具体范围、工具组合和条件设定,目前仍无独立第三方公开验证。
不能确认的是,Mythos是否真的能够在无辅助条件下,在短短几小时内攻破NSA的所有机密系统。
但是——这个”但是”很重要——即便打上所有应有的折扣,AISI已经公开验证的那些数字依然令人警觉:73%的专家级CTF通过率,32步企业网络攻击模拟的完整完成,181个工作漏洞利用程序vs.上一代的2个。
这意味着,即使NSA那段话需要”不应字面理解”,Mythos的能力边界也已经到了足以让最顶级的情报官员感到需要通报国会的程度。
亚马逊、达里奥和一场没有赢家的政治博弈
这次关闭事件还有一个容易被忽视的政治维度。
Anthropic和特朗普政府之间,在这次事件之前已经有了摩擦。这是4个月内政府第二次突然宣布针对Anthropic的行动。
而亚马逊的角色尤为耐人寻味。
亚马逊是Anthropic的最大外部投资方,在其架构中扮演不可或缺的角色,同时也是Project Glasswing的核心合作伙伴之一。
但根据Axios和多家媒体的报道,正是亚马逊CEO安迪·贾西直接绕过Anthropic,先去联系了白宫,把这件事升级成了政府级别的干预。
Anthropic说,他们收到的政府指令只有口头证据,没有书面技术报告;他们认为被定性为”越狱”的那个操作,其实是正常的安全研究行为,在其他竞争对手的模型上同样可以做到;他们认为这个指令的尺度完全超出了合理范围,不成比例。
政府的立场,经由白宫AI顾问戴维·萨克斯转述,是:不管研究者的意图是防御性的还是进攻性的,一旦技术能力越过了特定阈值,就必须采取行动。
这里涉及一个深层的政策分歧:技术能力本身,是否应该成为独立的管控依据?还是必须证明存在实际的滥用行为或滥用意图,才能采取限制措施?
在枪支管理领域,这个问题已经争论了几百年。在AI领域,这是第一次以如此直接的方式在政策层面被迫面对。
五眼联盟被一刀切断,反映的是什么
这次关闭中,盟友受到冲击的方式,其实比Anthropic本身的处境更值得分析。
英国AI安全研究所(AISI)的职能,就是独立测试和评估前沿AI模型的安全性,相当于AI领域的”核查机构”。这个机构正在积极评估Mythos 5,评估流程中途被直接切断。
根据英国AI部长卡尼沙卡·纳拉扬的说法,AISI已经对Mythos进行了评测,并”就评估结果采取了行动”。但现在的问题是,这个机构的工作被要求停止发布报告。
这对情报和安全合作的影响不是小事。五眼联盟的价值在于信息共享和协同防御,但当最关键的攻防工具的访问权限都被一纸行政令切断,而且连90分钟的应急通知都没有,盟友们的战略自主性受到了前所未有的挑战。
《经济学人》在另一篇社论中更进一步,把这件事上升到了技术霸权的层面:特朗普政府的这个指令,让全世界清楚看到,美国政府对谁可以使用全球最先进AI技术有着决定性的否决权。
无论是最亲密的盟友、还是测试前沿AI安全性的专业机构,都可以在没有任何预警的情况下被排除在外。
递归自我改进:那个让所有人都睡不好觉的数字
Anthropic在6月4日,也就是Fable 5发布前一周,公开了一组内部数据。
其中最关键的一个数字是:Mythos Preview在一项标准化基准测试中,将AI训练代码的运行速度提升了52倍。
这个测试的设计是这样的:给AI一段用于训练小型神经网络的代码,让它进行优化,看能提升多少速度。一个经验丰富的工程师,通常需要4到8小时,能实现4倍左右的提速。
Claude Opus 4,也就是上一代旗舰模型,在2024年实现了约3倍提速。Mythos Preview,今年4月,实现了52倍。
同一份报告里还有另一个数字:在一项测试AI研究判断力的评估中,Mythos Preview有64%的概率能识别出人类研究员走错了路,并给出更好的下一步决策。
2024年这个数字是22%。一年时间,从22%跳到64%。
这是什么概念?这意味着这个模型已经开始能够在某种程度上参与到自身的改进过程中——至少是能够优化训练代码这个层面。
这就是Anthropic自己所说的”递归自我改进(RSI)早期迹象”的技术来源。
需要明确说明的是:目前的证据表明,Mythos能够优化特定的训练代码,能够在给定研究情境下识别人类的错误决策,但还没有证据表明它能够自主设定研究议题或自主决定改进自身的方向。
RSI的完整定义需要模型能够主动推进自身能力的提升,而不只是在给定任务框架内表现优秀。
但即便如此,《卫报》上有一篇由计算机科学家斯图尔特·罗素撰写的评论文章,题目是”我们需要一场’切尔诺贝利规模的灾难’才会监管AI吗”——这个标题,在Mythos事件之后显得格外刺眼。
图尔西·加巴德准备公布有关中情局秘密“精神控制”项目和福奇博士的重磅文件
日本成为美国“创世纪计划”(又称“人工智能曼哈顿计划”)的首个海外合作伙伴
特朗普是袭击目标吗?FBI 挫败了一起据称针对白宫 UFC 赛事的无人机袭击计划
内塔尼亚胡的”文件门”,一场从地下室停车场开始的间谍案
弹药大管家之死!俄罗斯将军达维多夫遇刺事件深度解析与开源调查实战指南
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:情报分析师 文刀 文刀《Anthropico 公司的 Mythos 人工智能在数小时内几乎攻破了所有美国国家安全局的机密系统》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论