AI辅助渗透测试,进化到Skills阶段了

admin 2026-05-31 04:22:35 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 文档探讨AI辅助渗透测试进入Skills阶段的新趋势,指出通用AI助理通过添加Skill文件即可扩展渗透能力,无需编写复杂代码。重点介绍KaliClaw和Transilience等开源项目如何将渗透测试能力模块化,覆盖完整测试生命周期。分析该趋势的技术基础是LLM能直接执行文本描述的任务流程,并列举TrailofBits等机构的相关实践,预测通用工具将逐步取代部分专用工具。 综合评分: 82 文章分类: 渗透测试,AI安全,安全工具,红队,安全运营


cover_image

AI辅助渗透测试,进化到Skills阶段了

原创

孙志敏 孙志敏

AI与安全

2026年5月29日 08:05 北京

在小说阅读器读本章

去阅读

AI辅助渗透测试,近两年在快速发展,各种开源百花齐放,精彩异常。本站也曾介绍过多个渗透测试的开源,包括PentestGPT,CybersecurityAI(CAI),Kali MCP,Hexstrike,Strix等多个优秀的开源软件和论文。

最近一段时间,随着OpenClaw ,Hermes等AI通用助理的发展,又出现一个新的趋势,那就是在通用助理上使用Skills辅助渗透测试的任务,这是一个新的方向和趋势,值得关注。

1

两个使用Skills做渗透测试的例子

今年开始,随着Openclaw大热,以Openclaw,Hermes为代表的新一代个人助理迅速发展。它们的核心特点是:通用、能跑长任务,而且——扩展新能力只需要”增加一个 Skill”

什么是 Skill?简单就是一个文件夹,里面有一个 SKILL.md(YAML 头部 + Markdown 指令),告诉 AI”遇到这类任务该怎么做”。不需要 SDK,不需要编译,写一段 Markdown 就行。

于是一个很自然的问题出现了:既然加个 Skill 就能扩展能力,那能不能加个”渗透测试 Skill”,让通用助理直接去做渗透?

答案是:能,而且已经有人做出来了。

例子一:OpenClaw + Kali Claw

Kali Claw 就是这么个项目——它本身不是一个独立工具,而是构建在 OpenClaw 框架之上、运行在 Kali Linux 上的一个安全 Agent。它把全部渗透能力组织成了 49 个安全技能域,全都放在 skills/ 目录下,每个技能域包含 SKILL.md、攻击载荷、测试用例和学习指南。它能驾驭 Kali 里的 518 个安全工具(100% 覆盖),还有分层记忆系统和”心跳”自学习机制。

最妙的是它的可复用性:复制一份工作区、改 4 个文件,你就得到了一个全新的安全 Agent。能力靠 Skill 组织,扩展靠加 Skill 完成。

它的开源在https://github.com/brucesongs/kali-claw

我用Deepseek v4 Pro,实际跑了几个任务,效果尚可。

例子二:Claude Code + Transilience

如果说 Kali Claw 证明了这条路走得通,那安全公司 Transilience AI 开源的 communitytools 则证明了它真能产品化落地。这套工具原生跑在 Claude Code 上,git clone 之后用 Claude Code 打开,Skill 自动加载,无需任何额外配置。它包含 7 个安全 Skill、35 多个专用 Agent、14 个斜杠命令,覆盖了从侦察到报告的完整渗透生命周期,100% 覆盖 OWASP Top 10。

它的运作是个清晰的三层结构:Skill 层(经 /pentest 这类命令触发)→ Agent 层(一个编排 Agent 按 7 阶段 PTES 方法论协调,再派出 35+ 个专用 Agent 并行测 SQL 注入、XSS、SSRF、JWT……)→ Tool 层(Playwright 跑浏览器、HTTP 测试、截图录屏取证),最后输出带 CVSS 评分的专业报告。

开源在 https://github.com/transilienceai/communitytools

2

为什么Skills能用

在代码时代,我们先画一个注程图,或者一个流程描述,然后根据流程写代码实现功能,这是正常的流程,也没有其它办法,因为机器无法理解流程图或流程描述。

有了LLM以后,世界变得不一样了,AI可以按照一个流程描述直接去执行,这是通用工具,Skills,Memory,Harness这些技术的综合应用,也是技术进步的具体表现。

举个例子:

传统上,如果你想让 AI 帮你做”每天自动巡检外网资产、发现新增端口和高危漏洞”这件事,你大概会去写一段脚本:调度逻辑、调用 nmap、解析输出、和昨天的结果做 diff、再推送告警……几百行 Python 跑不掉,还得维护。

而用 Skill 的方式,你只需要写一个 daily-asset-recon/SKILL.md

---name: daily-asset-recondescription: 每日巡检外网资产,发现新增端口与高危漏洞并告警schedule: "0 8 * * *"   # 每天 08:00---## 任务步骤  1. 用 nmap 扫描 scope.txt 中的资产  2. 用 nuclei 对开放服务跑漏洞模板  3. 与昨天的基线 diff,提取变化项  4. 高危项推送 Telegram,生成日报
就这么几行自然语言。剩下的——什么时候触发、具体怎么调 nmap、怎么解析那一堆杂乱输出、怎么和昨天对比、判断哪些算"新增高危"——全都交给 AI 在运行时自己去理解和执行。你描述"要做什么",而不是编写"怎么一步步做"。 解析噪声输出、做差异判断这些原本最需要写代码的环节,恰恰是 AI 最擅长的。

加新能力,也只是再多写一个这样的 Markdown 文件而已。这就是”用 Skill 代替代码”的含义。

所以,根本的进步,是执行环境变了,从只能执行代码,到可以执行文本。

3

这已经成为一种趋势

#

如果只有 Kali Claw 和 Transilience,或许还能说是个例。但当你把视野放宽,会发现”把渗透能力 Skills 化”已经是一条清晰且在加速的路线,参与者横跨社区、顶级安全公司:

  • Trail of Bits 的 skills 仓库

    ——这家是业界最受尊敬的安全研究公司之一,他们的 skills 仓库被视为安全向 Skill 的”黄金标准”,4.9k stars,28 个以上的 SKILL.md,覆盖代码审计和静态分析全流程。

  • awesome-claude-skills-security

    ——把著名的 SecLists 字典、攻击载荷、webshell 全打包成 Claude Code 的 Skill,还附带 pentest、CTF、bug bounty 几个专家 Agent。

  • alirezarezvani/claude-skills

    ——一个 300 多个 Skill 的大集合,其中的安全渗透 Skill 覆盖扫描、密钥检测、报告生成,且能跨多个 AI 编程助理通用。

  • 学术界

    也在跟进,虽未看到直接用Skills渗透测试的论文,但已经出现了 EvoSkills、Memento-Skills 这类”自进化 Skill”框架的论文,让 Agent 能够自主生成、迭代优化多文件的技能包,而无需重新训练底层模型。

4

小结

暂时看,基于Skills的通用工具,在渗透能力上还弱于专用工具,但这使我想起了早期的智能手机和卡片相机的关系,卡片相机能力优于智能手机,但随着手机的进步,卡片相机很快被手机取代。类似的例子很多。

所以,通用工具会逐步取代很多的专用工具。

当然,一些优秀的专用工具仍然会持续发展,一如今天的单反相机,专业的游戏机。

这是趋势的力量。

关联阅读

Strix,融合源码理解与运行态验证的 AI 渗透测试框架

Hexstrike AI在多个工具及模型上的渗透测试表现


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:AI与安全 孙志敏 孙志敏《AI辅助渗透测试,进化到Skills阶段了》

评论:0   参与:  0