文章总结: 本文探讨了AI在代码审计领域的应用潜力,通过使用ClaudeOpus4.6模型对一个已知项目进行测试,发现AI不仅能像传统静态扫描器一样识别漏洞(如SQL注入),还能深入分析复杂的调用链,准确发现并验证了一个存储型远程代码执行(StoredRCE)漏洞。该漏洞的输入点与触发点分离,AI在几分钟内完成了人工可能需要数小时的分析工作,并提供了清晰的调用路径和有效载荷,显著提升了审计效率。 综合评分: 85 文章分类: 代码审计,AI安全,WEB安全,渗透测试,漏洞分析
stored RCE?:AI代码审计到底怎样?
原创
AdminTony AdminTony
川云安全团队
2026年2月24日 23:46 四川
1、背景
最近Claude Security Code做代码审计很火, 而且看完官方提供的zero-days文章以后, 还是挺惊讶的AI的想象力,如下:。
https://red.anthropic.com/2026/zero-days/
虽然Claude Security Code试用不了,都是依赖背后的LLM模型的话,直接用cursor替代会怎么样呢?
2、测试
用之前审计过的一个项目来测试,这里模型使用的Claude Opus 4.6,先直接对项目跑一遍看看:
首先,任务拆分的挺好的,把关键的一些漏洞都做了checklist,单独进行检查。
然后,在过程中,发现如果只用cursor的话,其逻辑还是静态特征查询,然后定位到代码片段进行分析,这点上和静态扫描器区别不大。
静态扫描器最大的问题就是污点追踪做的不太好(ps:个人感觉),痛点是扫出来一堆漏洞,但是人工分析成本大,那么大模型会解决这个问题么? 我们看下报告。
其中SQL注入那几个问题,是之前人工审计发现过,且提交过的,没有新增内容,主要目光放在RCE。
看到还是静态扫描器类似的问题,会把一些非controller里面的问题报出来(在controller调用到model的时候,可能做了检查,或者参数已经变的不可控了)。
到这里是比较失望的,感觉和静态扫描没啥太大的区别。
3、真RCE?还是假RCE?
接着,让大模型分析一下其调用链,是真的RCE?还是假的RCE?
然后它进行了一系列的查询,最终确定调用链。
完整调用链示意图:
调用路径和触发条件,写的清清楚楚的,后来人工分析了一下这个攻击链,确实可以执行。确实牛逼!
漏洞本身也挺有意思的, RCE的输入点和触发点是分开的,有点存储XSS的感觉,AI描述Stored RCE 很形象。
这里大模型简化了很多的人工分析工作,评估了一下,如果人工审计这个漏洞,找输入点 和 触发点的话,估计得2小时时间,甚至更高,但是大模型几分钟就完成了。非常节省效率,而且还把payload准确的给出来了。
4、Stored RCE!干!
输入点:
触发点:点开购物车到下单页面,计算器触发!
5、总结
AI在代码审计领域表现出了非常强大的能力,可能Claude Security Code还有更高端的玩法:语义理解、git历史提交记录的对比分析,如果不付费使用Claude Security Code的话,手搓一个MCP、skills或者工作流大概也能实现相应的效果。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:川云安全团队 AdminTony AdminTony《stored RCE?:AI代码审计到底怎样?》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论