文章总结: Cloudflare将Anthropic的MythosPreview模型应用于50多个自研代码仓库的审计,观察其在漏洞发现中的表现。该模型不仅能发现漏洞,还能像安全研究员一样组合多个漏洞原语以构造攻击链,并生成可运行的验证代码。此外,Cloudflare搭建了一条多agent自动化流水线来并行执行漏洞搜索任务,并通过反向验证等方式提高准确性。文章最后强调,虽然AI能加速补丁发布,但跳过回归测试可能引入新问题,真正的防御应注重多重防线和系统韧性。 综合评分: 85 文章分类: ai安全,代码审计,解决方案,威胁情报,网络安全
改变战局!Cloudflare亲测Mythos,AI漏洞审计进入生产
原创
玄月调查小组 玄月调查小组
玄月调查小组
2026年5月19日 01:06 上海
在小说阅读器读本章
去阅读
【导读】Cloudflare将Mythos Preview 用于审查 50 多个自研代码仓库,观察 AI 如何发现漏洞、构造攻击链、生成可验证证明。前沿模型正在把安全研究从人工推向自动化。
Mythos进入真实代码审计场景
网络安全的攻防节奏,正在被前沿AI加速。
主角是 Anthropic 的 Mythos Preview。
Cloudflare 将 Mythos 用于检查 50 多个自研代码仓库,评估模型在漏洞发现中的实际表现。
真正值得警惕的,不只是模型能报告漏洞。
而是它开始像安全研究员一样,把多个漏洞原语组合成攻击链!
低危问题,能被组合成高危利用路径。
低危漏洞被组合成攻击链
Cloudflare 明确指出,真实的攻击很少只依赖单个漏洞。
攻击者常常会串联多个利用原语:从UAF,到任意读写,再到控制流劫持,最后借助 ROP 链获得系统控制能力。
过去,很多模型只能停留在「这里可能存在漏洞」的层面。
Mythos Preview 的变化在于,它会继续推理漏洞原语之间的组合关系。
它不仅能分析这些原语如何形成攻击链,还能进一步构造可运行的验证证明。
它不只生成文字报告。
它会编写触发疑似漏洞的代码,在沙盒中编译并运行。
如果程序行为不符合预期,它会读取失败结果,修正假设并再次尝试。
这就是安全研究中的关键分界线:
AI 正在从「发现疑点」走向「证明漏洞可被利用」。
Cloudflare 的原话很克制,但意思已经到了。
一个带 PoC 的发现,和一个「可能存在问题」的发现,完全不是同一种结果。
前者能直接进入修复决策,后者只是消耗人类时间。
而 Mythos Preview 的变化,正卡在这个关键点上。
安全护栏,仍然不稳定
更值得关注的是,模型的安全边界仍然不稳定。
Cloudflare 观察到:
Project Glasswing 中使用的 Mythos Preview 并不包含一般可用模型所具备的额外安全防护机制。
即便如此,它有时仍会自发拒绝某些请求。
问题在于,这种拒绝并不一致。
同一段代码,同一类研究任务,换一个上下文,模型可能从拒绝变成同意。
同义任务在不同运行中,也可能走向相反结果。
说明安全边界还不能作为稳定防线。
Cloudflare 判断:未来任何面向公众使用的网络安全前沿模型,都必须叠加额外安全防护。
否则,能力越强,风险越不受控。
50个漏洞任务并行运行
真正改变战局的,是 Cloudflare 没有把它当聊天机器人用。
他们很快发现,把一个通用的coding agent 接入仓库,让它笼统地「寻找漏洞」,远远不够。
一个agent面对 100000 行级代码仓库,可能只能有效覆盖十分之一百分点量级的攻击面。
当上下文窗口耗尽,早期发现的问题还可能在摘要压缩中丢失。
所以Cloudflare搭出一条 harness,把漏洞发现拆成几个阶段,把模型塞进流水线。
侦察阶段先读取仓库,生成架构文档、信任边界、入口点和攻击面。
狩猎阶段,每个任务只盯一个攻击类别和一个范围提示。
通常约 50 个漏洞搜索任务并行运行!
每个搜索任务还会派生多个探索subagent,在独立目录中编译并运行概念验证代码。
验证阶段则由另一个独立agent进行反向验证。
它使用不同提示词和不同模型,而且生成新的漏洞发现,只负责判断原始发现是否成立。
Cloudflare:让两个agent进行有意对抗,比让一个agent进行自我审查更有效。
后面还有 补全、去重、追踪、反馈、报告。
其中追踪最关键。
它要判断共享库中的漏洞,是否真的能被外部攻击者控制的输入触达。
这一步把「这里有漏洞」变成了「这里有可达漏洞」。
安全研究,正在被拆解成一条多agent自动化流程。
而这套流程已经覆盖 Cloudflare 的运行时、边缘数据路径、协议栈、控制平面,以及依赖的开源项目。
两小时补丁,不是最终答案
Cloudflare 最后给安全团队提出了一个更现实的问题。
很多安全负责人现在盯着速度:扫描更快,补丁更快,把响应周期压缩。
不止一个安全团队,已经在按「CVE 发布到生产补丁 2 小时」的SLA运行。
但 Cloudflare 说,光更快不够。
如果回归测试需要一天。
那么 2 小时 SLA 的唯一实现方式,就是跳过测试。
跳过测试直接发布补丁,可能修复原始漏洞,却引入新的系统依赖问题。
Cloudflare 自己就吃过这个血亏:AI补丁修复了原始漏洞,却破坏了其他依赖关系。
更快的补丁,救不了你。
真正的防御,是即使漏洞存在,也要让攻击者更难触达。
要有挡在应用前面的防线,要让一个局部漏洞不能横向横向蔓延到整个系统。。
还要能把修复同时推到代码运行的每个节点。
最后,Cloudflare 承认,这项能力是双刃剑。
它能帮助他们发现自有代码中的漏洞。
但落到错误的人手里,也会加速针对互联网的攻击。
AI正在缩小整个攻防时间窗口。
大多数团队目前还没准备好。
参考资料: https://blog.cloudflare.com/cyber-frontier-models/
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:玄月调查小组 玄月调查小组 玄月调查小组《改变战局!Cloudflare亲测Mythos,AI漏洞审计进入生产》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论