2026-01-30 18:20:20 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： UIUC团队研发HPTSA系统，利用GPT-4分层规划与多智能体协作，实现无先验知识下自主挖掘0Day漏洞。测试中其成功率达42%，远超传统工具及开源模型。单次攻击成本仅24美元，远低于人工，表明AI在自动化红队与漏洞挖掘中具备高效、低成本及高扩展性的颠覆潜力。 综合评分： 87 文章分类： AI安全,红队,漏洞分析,Web安全,渗透测试

cover_image

【论文推荐】大模型组队挖掘0day，成功率竟然远超专业工具？

原创

heyong heyong

AI安全圈

2026年1月29日 18:31 江苏

有跳槽或找工作的同学，先看看招聘帖：

继续招人，AI安全方向

过去，大语言模型（LLM）的表现大多局限于 Capture-the-Flag（CTF）夺旗赛等已知挑战，或者在人类提供漏洞描述的前提下扮演“助手”。

伊利诺伊大学厄巴纳-香槟分校（UIUC）研究团队的最新发现，GPT-4 驱动的智能体架构，已经具备了在完全没有任何先验知识的情况下，自主发现并利用真实世界0Day 能力。

早期的研究表明，单一 AI 智能体在面对复杂的网络渗透任务时往往会陷入僵局。

原因在于网络攻击是一个极度依赖长程规划的过程，单体模型容易受限于上下文长度限制，且在遭遇技术死胡同时，往往会陷入重复尝试的逻辑循环，难以有效回溯。

UIUC 团队开发了 HPTSA（分层规划与特定任务智能体）系统，模仿人类红队分工的团队作战架构，其核心组件包括：

分层规划器（Hierarchical Planner）：担任“主帅”，负责全局探索。它使用 Playwright作为自己的“眼睛和手”，浏览目标网站，并制定高层指令，识别潜在的风险页面。
团队管理器（Team Manager）：担任“调度官”，负责接收主帅的指令并指派专家。如果某次尝试失败，管理器可以整合历史信息，并重新指派，避免智能体在失败的思路中“卡死”。
特定任务专家（Task-Specific Experts）：针对特定漏洞类型的 6 类专业智能体，包括：XSS（跨站脚本）专家、SQLi（SQL 注入）专家、CSRF（跨站请求伪造）专家、SSTI（服务器端模板注入）专家、ZAP 专家以及通用 Web 攻击专家。

为了提升效率，研究者还应用了HTML 简化策略：在将网页源码传递给智能体前，自动剥离、和等对漏洞挖掘无关的标签，让 AI 的注意力能集中在关键的交互逻辑上。

数据震撼：42% 的成功率

实验结果对传统防御体系构成了巨大的冲击。

在针对 14 个真实世界零日漏洞（均在模型知识截止日期后发布）的测试中，对比数据令人触目惊心：

HPTSA (GPT-4 驱动) 的表现：在 Pass@5（五次尝试中至少成功一次）的指标下，成功率达到了 42%。而在 Pass@1（单次尝试成功率）指标上，它比之前的单体智能体框架提升了高达 4.3 倍。
开源扫描工具（ZAP, MetaSploit）：面对这些未知的真实漏洞，成功率为 0%。
开源大模型（Llama-3 405B, Qwen-2.5 72B）：表现同样为 0%。

这种巨大的差异揭示了顶尖闭源模型与开源模型之间的“能力悬崖”。Llama-3 等模型的失败不仅在于逻辑推理不足。

在针对 flusity-CMS 内容管理系统的实战模拟中，HPTSA 展示了其令人惊叹的进化能力。挖掘到来两个关键漏洞：CVE-2024-24524 (CSRF) 和 CVE-2024-27757 (XSS)。

24 美元换一个高危漏洞？

除了经济账，比技术突破更让人不安是攻击成本的降维打击。

极低的单次成本：使用 GPT-4 驱动的 HPTSA，平均每次成功完成漏洞利用的成本仅为 24.4 美元。
人力成本对比：聘请一位人类安全专家（按每小时 50 美元计算，完成一次探索约需 1.5 小时）的成本约为 75 美元。

目前，AI 的攻击成本已不足人类的三分之一。

但，更具威胁性的是AI 具备无限的扩展性。它不会累，不像人一样需要吃饭睡觉休息。

你可以同时启动 1000 个智能体进行全网渗透，随着 GPT-4o 等模型价格的不断下探，研究人员预测，未来 1-2 年内，AI 攻击的成本还将进一步下降 3 到 6 倍。

需要论文的同学，请私信获取

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：AI安全圈 heyong heyong《【论文推荐】大模型组队挖掘0day，成功率竟然远超专业工具？》