【论文推荐】大模型组队挖掘0day,成功率竟然远超专业工具?

admin 2026-01-30 18:20:20 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: UIUC团队研发HPTSA系统,利用GPT-4分层规划与多智能体协作,实现无先验知识下自主挖掘0Day漏洞。测试中其成功率达42%,远超传统工具及开源模型。单次攻击成本仅24美元,远低于人工,表明AI在自动化红队与漏洞挖掘中具备高效、低成本及高扩展性的颠覆潜力。 综合评分: 87 文章分类: AI安全,红队,漏洞分析,Web安全,渗透测试


cover_image

【论文推荐】大模型组队挖掘0day,成功率竟然远超专业工具?

原创

heyong heyong

AI安全圈

2026年1月29日 18:31 江苏

有跳槽或找工作的同学,先看看招聘帖:

继续招人,AI安全方向

过去,大语言模型(LLM)的表现大多局限于 Capture-the-Flag(CTF)夺旗赛等已知挑战,或者在人类提供漏洞描述的前提下扮演“助手”。

伊利诺伊大学厄巴纳-香槟分校(UIUC)研究团队的最新发现,GPT-4 驱动的智能体架构,已经具备了在完全没有任何先验知识的情况下,自主发现并利用真实世界0Day 能力。

早期的研究表明,单一 AI 智能体在面对复杂的网络渗透任务时往往会陷入僵局。

原因在于网络攻击是一个极度依赖长程规划的过程,单体模型容易受限于上下文长度限制,且在遭遇技术死胡同时,往往会陷入重复尝试的逻辑循环,难以有效回溯。

UIUC 团队开发了 HPTSA(分层规划与特定任务智能体)系统,模仿人类红队分工的团队作战架构,其核心组件包括:

  • 分层规划器(Hierarchical Planner): 担任“主帅”,负责全局探索。它使用 Playwright作为自己的“眼睛和手”,浏览目标网站,并制定高层指令,识别潜在的风险页面。
  • 团队管理器(Team Manager): 担任“调度官”,负责接收主帅的指令并指派专家。如果某次尝试失败,管理器可以整合历史信息,并重新指派,避免智能体在失败的思路中“卡死”。
  • 特定任务专家(Task-Specific Experts): 针对特定漏洞类型的 6 类专业智能体,包括:XSS(跨站脚本)专家、SQLi(SQL 注入)专家、CSRF(跨站请求伪造)专家、SSTI(服务器端模板注入)专家、ZAP 专家以及通用 Web 攻击专家。

为了提升效率,研究者还应用了HTML 简化策略:在将网页源码传递给智能体前,自动剥离 、 和 等对漏洞挖掘无关的标签,让 AI 的注意力能集中在关键的交互逻辑上。

数据震撼:42% 的成功率

实验结果对传统防御体系构成了巨大的冲击。

在针对 14 个真实世界零日漏洞(均在模型知识截止日期后发布)的测试中,对比数据令人触目惊心:

  • HPTSA (GPT-4 驱动) 的表现: 在 Pass@5(五次尝试中至少成功一次)的指标下,成功率达到了 42%。而在 Pass@1(单次尝试成功率) 指标上,它比之前的单体智能体框架提升了高达 4.3 倍。
  • 开源扫描工具(ZAP, MetaSploit): 面对这些未知的真实漏洞,成功率为 0%。
  • 开源大模型(Llama-3 405B, Qwen-2.5 72B): 表现同样为 0%。

这种巨大的差异揭示了顶尖闭源模型与开源模型之间的“能力悬崖”。Llama-3 等模型的失败不仅在于逻辑推理不足。

在针对 flusity-CMS 内容管理系统的实战模拟中,HPTSA 展示了其令人惊叹的进化能力。挖掘到来两个关键漏洞:CVE-2024-24524 (CSRF) 和 CVE-2024-27757 (XSS)。

24 美元换一个高危漏洞?

除了经济账,比技术突破更让人不安是攻击成本的降维打击。

  • 极低的单次成本: 使用 GPT-4 驱动的 HPTSA,平均每次成功完成漏洞利用的成本仅为 24.4 美元。
  • 人力成本对比: 聘请一位人类安全专家(按每小时 50 美元计算,完成一次探索约需 1.5 小时)的成本约为 75 美元。

目前,AI 的攻击成本已不足人类的三分之一。

但,更具威胁性的是AI 具备无限的扩展性。它不会累,不像人一样需要吃饭睡觉休息。

你可以同时启动 1000 个智能体进行全网渗透,随着 GPT-4o 等模型价格的不断下探,研究人员预测,未来 1-2 年内,AI 攻击的成本还将进一步下降 3 到 6 倍。

需要论文的同学,请私信获取


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:AI安全圈 heyong heyong《【论文推荐】大模型组队挖掘0day,成功率竟然远超专业工具?》

评论:0   参与:  0