文章总结: UIUC团队研发HPTSA系统,利用GPT-4分层规划与多智能体协作,实现无先验知识下自主挖掘0Day漏洞。测试中其成功率达42%,远超传统工具及开源模型。单次攻击成本仅24美元,远低于人工,表明AI在自动化红队与漏洞挖掘中具备高效、低成本及高扩展性的颠覆潜力。 综合评分: 87 文章分类: AI安全,红队,漏洞分析,Web安全,渗透测试
【论文推荐】大模型组队挖掘0day,成功率竟然远超专业工具?
原创
heyong heyong
AI安全圈
2026年1月29日 18:31 江苏
有跳槽或找工作的同学,先看看招聘帖:
继续招人,AI安全方向
过去,大语言模型(LLM)的表现大多局限于 Capture-the-Flag(CTF)夺旗赛等已知挑战,或者在人类提供漏洞描述的前提下扮演“助手”。
伊利诺伊大学厄巴纳-香槟分校(UIUC)研究团队的最新发现,GPT-4 驱动的智能体架构,已经具备了在完全没有任何先验知识的情况下,自主发现并利用真实世界0Day 能力。
早期的研究表明,单一 AI 智能体在面对复杂的网络渗透任务时往往会陷入僵局。
原因在于网络攻击是一个极度依赖长程规划的过程,单体模型容易受限于上下文长度限制,且在遭遇技术死胡同时,往往会陷入重复尝试的逻辑循环,难以有效回溯。
UIUC 团队开发了 HPTSA(分层规划与特定任务智能体)系统,模仿人类红队分工的团队作战架构,其核心组件包括:
- 分层规划器(Hierarchical Planner): 担任“主帅”,负责全局探索。它使用 Playwright作为自己的“眼睛和手”,浏览目标网站,并制定高层指令,识别潜在的风险页面。
- 团队管理器(Team Manager): 担任“调度官”,负责接收主帅的指令并指派专家。如果某次尝试失败,管理器可以整合历史信息,并重新指派,避免智能体在失败的思路中“卡死”。
- 特定任务专家(Task-Specific Experts): 针对特定漏洞类型的 6 类专业智能体,包括:XSS(跨站脚本)专家、SQLi(SQL 注入)专家、CSRF(跨站请求伪造)专家、SSTI(服务器端模板注入)专家、ZAP 专家以及通用 Web 攻击专家。
为了提升效率,研究者还应用了HTML 简化策略:在将网页源码传递给智能体前,自动剥离 、 和 等对漏洞挖掘无关的标签,让 AI 的注意力能集中在关键的交互逻辑上。
数据震撼:42% 的成功率
实验结果对传统防御体系构成了巨大的冲击。
在针对 14 个真实世界零日漏洞(均在模型知识截止日期后发布)的测试中,对比数据令人触目惊心:
- HPTSA (GPT-4 驱动) 的表现: 在 Pass@5(五次尝试中至少成功一次)的指标下,成功率达到了 42%。而在 Pass@1(单次尝试成功率) 指标上,它比之前的单体智能体框架提升了高达 4.3 倍。
- 开源扫描工具(ZAP, MetaSploit): 面对这些未知的真实漏洞,成功率为 0%。
- 开源大模型(Llama-3 405B, Qwen-2.5 72B): 表现同样为 0%。
这种巨大的差异揭示了顶尖闭源模型与开源模型之间的“能力悬崖”。Llama-3 等模型的失败不仅在于逻辑推理不足。
在针对 flusity-CMS 内容管理系统的实战模拟中,HPTSA 展示了其令人惊叹的进化能力。挖掘到来两个关键漏洞:CVE-2024-24524 (CSRF) 和 CVE-2024-27757 (XSS)。
24 美元换一个高危漏洞?
除了经济账,比技术突破更让人不安是攻击成本的降维打击。
- 极低的单次成本: 使用 GPT-4 驱动的 HPTSA,平均每次成功完成漏洞利用的成本仅为 24.4 美元。
- 人力成本对比: 聘请一位人类安全专家(按每小时 50 美元计算,完成一次探索约需 1.5 小时)的成本约为 75 美元。
目前,AI 的攻击成本已不足人类的三分之一。
但,更具威胁性的是AI 具备无限的扩展性。它不会累,不像人一样需要吃饭睡觉休息。
你可以同时启动 1000 个智能体进行全网渗透,随着 GPT-4o 等模型价格的不断下探,研究人员预测,未来 1-2 年内,AI 攻击的成本还将进一步下降 3 到 6 倍。
需要论文的同学,请私信获取
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:AI安全圈 heyong heyong《【论文推荐】大模型组队挖掘0day,成功率竟然远超专业工具?》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论