storedRCE?:AI代码审计到底怎样?

admin 2026-03-03 06:15:47 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本文探讨了AI在代码审计领域的应用潜力,通过使用ClaudeOpus4.6模型对一个已知项目进行测试,发现AI不仅能像传统静态扫描器一样识别漏洞(如SQL注入),还能深入分析复杂的调用链,准确发现并验证了一个存储型远程代码执行(StoredRCE)漏洞。该漏洞的输入点与触发点分离,AI在几分钟内完成了人工可能需要数小时的分析工作,并提供了清晰的调用路径和有效载荷,显著提升了审计效率。 综合评分: 85 文章分类: 代码审计,AI安全,WEB安全,渗透测试,漏洞分析


cover_image

stored RCE?:AI代码审计到底怎样?

原创

AdminTony AdminTony

川云安全团队

2026年2月24日 23:46 四川

1、背景

最近Claude Security Code做代码审计很火, 而且看完官方提供的zero-days文章以后, 还是挺惊讶的AI的想象力,如下:。

https://red.anthropic.com/2026/zero-days/

虽然Claude Security Code试用不了,都是依赖背后的LLM模型的话,直接用cursor替代会怎么样呢?

2、测试

用之前审计过的一个项目来测试,这里模型使用的Claude Opus 4.6,先直接对项目跑一遍看看:

首先,任务拆分的挺好的,把关键的一些漏洞都做了checklist,单独进行检查。

然后,在过程中,发现如果只用cursor的话,其逻辑还是静态特征查询,然后定位到代码片段进行分析,这点上和静态扫描器区别不大。

静态扫描器最大的问题就是污点追踪做的不太好(ps:个人感觉),痛点是扫出来一堆漏洞,但是人工分析成本大,那么大模型会解决这个问题么? 我们看下报告。

其中SQL注入那几个问题,是之前人工审计发现过,且提交过的,没有新增内容,主要目光放在RCE。

看到还是静态扫描器类似的问题,会把一些非controller里面的问题报出来(在controller调用到model的时候,可能做了检查,或者参数已经变的不可控了)。

到这里是比较失望的,感觉和静态扫描没啥太大的区别。

3、真RCE?还是假RCE?

接着,让大模型分析一下其调用链,是真的RCE?还是假的RCE?

然后它进行了一系列的查询,最终确定调用链。

完整调用链示意图:

调用路径和触发条件,写的清清楚楚的,后来人工分析了一下这个攻击链,确实可以执行。确实牛逼!

漏洞本身也挺有意思的, RCE的输入点和触发点是分开的,有点存储XSS的感觉,AI描述Stored RCE 很形象。

这里大模型简化了很多的人工分析工作,评估了一下,如果人工审计这个漏洞,找输入点 和 触发点的话,估计得2小时时间,甚至更高,但是大模型几分钟就完成了。非常节省效率,而且还把payload准确的给出来了。

4、Stored RCE!干!

输入点:

触发点:点开购物车到下单页面,计算器触发!

5、总结

AI在代码审计领域表现出了非常强大的能力,可能Claude Security Code还有更高端的玩法:语义理解、git历史提交记录的对比分析,如果不付费使用Claude Security Code的话,手搓一个MCP、skills或者工作流大概也能实现相应的效果。


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:川云安全团队 AdminTony AdminTony《stored RCE?:AI代码审计到底怎样?》

评论:0   参与:  0