LLM越来越多地发现零日漏洞,颠覆传统源代码审计方法

admin 2026-02-17 20:18:09 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 大型语言模型正颠覆传统源代码审计方法,通过分析海量代码和模拟攻击路径发现零日漏洞。Anthropic的ClaudeOpus4.6发现500多个开源漏洞,Google的BigSleep在SQLite中找到内存安全漏洞,OpenAI的o3在Linux内核中发现远程零日漏洞。研究显示GPT-4代理在真实漏洞利用中成功率达87%。LLM提供自动化、规模化审计能力,但也带来被滥用于生成漏洞利用代码、假阳性和逆向工程补丁等新风险。未来需平衡AI辅助审计与伦理框架,实现人机协作的主动防御。 综合评分: 78 文章分类: AI安全,漏洞分析,安全工具,代码审计,威胁情报


cover_image

LLM 越来越多地发现零日漏洞,颠覆传统源代码审计方法

王慧敏 王慧敏

AI与代码安全

2026年2月10日 08:58 北京

LLM 越来越多地发现零日漏洞,颠覆源代码审计

在数字安全的世界中,零日漏洞(Zero-Day Vulnerabilities)一直是黑客与防御者之间无声的战场。这些漏洞在被发现前无人知晓,往往导致严重的系统入侵和数据泄露。传统上,源代码审计依赖于人类专家的细致审查,但如今,大型语言模型(LLM)正以惊人的速度改变这一切。LLM 越来越多地发现零日漏洞,颠覆源代码审计——这句话不仅仅是一个观察,更是预示着网络安全领域的范式转变。本文将探讨这一现象的兴起、真实案例及其深远影响。

一、零日漏洞与传统源代码审计的局限性

首先,让我们澄清概念。零日漏洞指的是软件中尚未被开发者或安全社区发现并修复的安全缺陷。一旦被恶意利用,它能造成从数据窃取到远程代码执行(RCE)的各种危害。传统源代码审计是一种手动或半自动过程,由安全专家逐行检查代码,寻找潜在问题。这方法有效,但耗时、昂贵且依赖人类经验。审计一个大型开源项目可能需要数月,甚至数年,而且人类容易遗漏复杂或隐藏的漏洞。

随着软件规模的爆炸式增长——想想Linux内核或OpenSSL这样的核心基础设施——传统审计已显疲态。漏洞往往潜伏多年未被发现,直到造成实际损害。进入LLM时代,这些AI模型通过分析海量代码、模拟攻击路径和识别模式,正成为漏洞猎人的新利器。

二、LLM 在漏洞发现中的崛起:真实案例

近年来,LLM 的能力已从理论转向实践。多家AI公司和研究者报告了LLM 独立或辅助发现零日漏洞的案例,这些发现不仅数量惊人,还覆盖了从操作系统到数据库的广泛领域。

例如,Anthropic的Claude Opus 4.6模型在未经特殊优化的情况下,发现了500多个开源代码库中的零日漏洞,其中一些已潜伏数十年未被察觉。 该模型通过分析代码变更历史和潜在弱点,快速定位问题,如在Type 1 charstrings中的栈边界检查缺失。这颠覆了传统审计的缓慢节奏——LLM能在短时间内扫描数百万行代码。

另一个突出例子是Google的Big Sleep框架(前身为Project Naptime),它利用LLM在SQLite数据库引擎中发现了一个内存安全漏洞,这是首个公开的AI代理在真实软件中找到的零日问题。 SQLite 被广泛用于浏览器和移动应用,这个发现展示了LLM如何处理复杂内存问题,超越人类审计的盲点。

在更具规模的案例中,AISLE使用AI系统在OpenSSL中发现了12个零日漏洞,其中包括一个高危漏洞。 OpenSSL是互联网加密的基础,这意味着AI的介入直接提升了全球网络的安全水平。同样,OpenAI的o3模型在Linux内核的SMB实现中找到了一个远程零日漏洞(CVE-2025-37899),证明LLM能在最严苛的代码环境中发挥作用。

此外,研究显示LLM代理团队能自主利用零日漏洞。在一项实验中,GPT-4驱动的代理在真实世界漏洞中成功率达87%,远超其他开源工具。 另一个项目,ZeroPath的工具,自2024年7月起发现了多个RCE和认证绕过漏洞,针对AI平台和开源项目。

社交媒体上也充斥着相关讨论。例如,一位安全研究者在X(前Twitter)上分享了Claude模型发现500个漏洞的帖子,强调这是开源社区多年遗漏的。 另一位用户讨论了o3在Linux内核中的发现,突显LLM在信息安全中的潜力。

这些案例并非孤立。Berkeley的研究显示,GPT-5代理在模拟环境中发现了35个零日漏洞和17个不完整补丁,平均漏洞潜伏期达969天。 LLM的“蛮力耐心”——通过反复迭代和模式匹配——让它们在发现隐藏问题上胜过人类。

三、颠覆源代码审计:机遇与挑战

LLM的介入正彻底颠覆源代码审计。传统方法依赖专家团队,而LLM提供自动化、规模化和实时分析。想象一下:一个AI代理能24/7扫描代码仓库,预测潜在漏洞,甚至生成补丁建议。这不仅加速了修复周期,还降低了成本。Anthropic的报告中提到,Claude通过检查提交历史快速识别安全相关变更,这比手动审计高效得多。

积极影响显而易见:更安全的软件生态。开源项目如OpenSSL和Linux受益于AI的“第二双眼睛”,减少了零日攻击的风险。企业也能整合LLM到DevSecOps流程中,实现连续审计。

然而,挑战不可忽视。LLM可能被滥用于恶意目的——黑客使用AI生成 exploits,正如一篇报告所述,LLM代理能工业化生产漏洞利用代码。 此外,AI发现的漏洞可能引入新风险,如假阳性或模型偏差。Anthropic强调了缓解措施,如限制模型访问敏感代码和人类监督。

另一个问题是“负日”漏洞:LLM能逆向工程补丁,预测已修复但未公开的漏洞。 这加速了从CVE发布到利用的时间,Mandiant报告显示,零日利用在2023年占主导。

四、未来展望:AI驱动的安全新时代

LLM 越来越多地发现零日漏洞,颠覆源代码审计,这不是科幻,而是2026年的现实。到目前为止,AI已证明其在关键基础设施中的价值,但我们必须平衡创新与风险。开发者应采用AI辅助审计工具,如Big Sleep或ÆSIR,同时加强伦理框架。

最终,这一转变将使网络安全更主动、更智能。人类专家不会被取代,而是与AI协作,形成更强的防御。作为从业者,我们应拥抱这一变革,确保AI成为盟友而非威胁。

 【AI代码助手、大模型课题、代码静态分析工具、动态分析工具、软件成分分析与同源漏洞检测、渗透测试工具、模糊测试、恶意代码检测平台、软件漏洞挖掘平台、软件供应链安全平台。试用及合作请后台私信工程师13381155803(微信同步)】


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:AI与代码安全 王慧敏 王慧敏《LLM 越来越多地发现零日漏洞,颠覆传统源代码审计方法》

评论:0   参与:  0