2026-05-31 04:22:35 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 文档探讨AI辅助渗透测试进入Skills阶段的新趋势，指出通用AI助理通过添加Skill文件即可扩展渗透能力，无需编写复杂代码。重点介绍KaliClaw和Transilience等开源项目如何将渗透测试能力模块化，覆盖完整测试生命周期。分析该趋势的技术基础是LLM能直接执行文本描述的任务流程，并列举TrailofBits等机构的相关实践，预测通用工具将逐步取代部分专用工具。 综合评分： 82 文章分类： 渗透测试,AI安全,安全工具,红队,安全运营

cover_image

AI辅助渗透测试，进化到Skills阶段了

原创

孙志敏孙志敏

AI与安全

2026年5月29日 08:05 北京

在小说阅读器读本章

去阅读

AI辅助渗透测试，近两年在快速发展，各种开源百花齐放，精彩异常。本站也曾介绍过多个渗透测试的开源，包括PentestGPT,CybersecurityAI(CAI),Kali MCP,Hexstrike,Strix等多个优秀的开源软件和论文。

最近一段时间，随着OpenClaw ,Hermes等AI通用助理的发展，又出现一个新的趋势，那就是在通用助理上使用Skills辅助渗透测试的任务，这是一个新的方向和趋势，值得关注。

两个使用Skills做渗透测试的例子

今年开始，随着Openclaw大热，以Openclaw,Hermes为代表的新一代个人助理迅速发展。它们的核心特点是：通用、能跑长任务，而且——扩展新能力只需要”增加一个 Skill”。

什么是 Skill？简单就是一个文件夹，里面有一个 SKILL.md（YAML 头部 + Markdown 指令），告诉 AI”遇到这类任务该怎么做”。不需要 SDK，不需要编译，写一段 Markdown 就行。

于是一个很自然的问题出现了：既然加个 Skill 就能扩展能力，那能不能加个”渗透测试 Skill”，让通用助理直接去做渗透？

答案是：能，而且已经有人做出来了。

例子一：OpenClaw + Kali Claw

Kali Claw 就是这么个项目——它本身不是一个独立工具，而是构建在 OpenClaw 框架之上、运行在 Kali Linux 上的一个安全 Agent。它把全部渗透能力组织成了 49 个安全技能域，全都放在 skills/ 目录下，每个技能域包含 SKILL.md、攻击载荷、测试用例和学习指南。它能驾驭 Kali 里的 518 个安全工具（100% 覆盖），还有分层记忆系统和”心跳”自学习机制。

最妙的是它的可复用性：复制一份工作区、改 4 个文件，你就得到了一个全新的安全 Agent。能力靠 Skill 组织，扩展靠加 Skill 完成。

它的开源在https://github.com/brucesongs/kali-claw

我用Deepseek v4 Pro，实际跑了几个任务，效果尚可。

例子二：Claude Code + Transilience

如果说 Kali Claw 证明了这条路走得通，那安全公司 Transilience AI 开源的 communitytools 则证明了它真能产品化落地。这套工具原生跑在 Claude Code 上，git clone 之后用 Claude Code 打开，Skill 自动加载，无需任何额外配置。它包含 7 个安全 Skill、35 多个专用 Agent、14 个斜杠命令，覆盖了从侦察到报告的完整渗透生命周期，100% 覆盖 OWASP Top 10。

它的运作是个清晰的三层结构：Skill 层（经 /pentest 这类命令触发）→ Agent 层（一个编排 Agent 按 7 阶段 PTES 方法论协调，再派出 35+ 个专用 Agent 并行测 SQL 注入、XSS、SSRF、JWT……）→ Tool 层（Playwright 跑浏览器、HTTP 测试、截图录屏取证），最后输出带 CVSS 评分的专业报告。

开源在 https://github.com/transilienceai/communitytools

为什么Skills能用

在代码时代，我们先画一个注程图，或者一个流程描述，然后根据流程写代码实现功能，这是正常的流程，也没有其它办法，因为机器无法理解流程图或流程描述。

有了LLM以后，世界变得不一样了，AI可以按照一个流程描述直接去执行，这是通用工具，Skills,Memory,Harness这些技术的综合应用，也是技术进步的具体表现。

举个例子：

传统上，如果你想让 AI 帮你做”每天自动巡检外网资产、发现新增端口和高危漏洞”这件事，你大概会去写一段脚本：调度逻辑、调用 nmap、解析输出、和昨天的结果做 diff、再推送告警……几百行 Python 跑不掉，还得维护。

而用 Skill 的方式，你只需要写一个 daily-asset-recon/SKILL.md：

---name: daily-asset-recondescription: 每日巡检外网资产，发现新增端口与高危漏洞并告警schedule: "0 8 * * *" &nbsp; # 每天 08:00---##&nbsp;任务步骤&nbsp; 1. 用 nmap 扫描 scope.txt 中的资产&nbsp; 2. 用 nuclei 对开放服务跑漏洞模板&nbsp; 3. 与昨天的基线 diff，提取变化项&nbsp; 4. 高危项推送 Telegram，生成日报

就这么几行自然语言。剩下的——什么时候触发、具体怎么调 nmap、怎么解析那一堆杂乱输出、怎么和昨天对比、判断哪些算"新增高危"——全都交给 AI 在运行时自己去理解和执行。你描述"要做什么"，而不是编写"怎么一步步做"。&nbsp;解析噪声输出、做差异判断这些原本最需要写代码的环节，恰恰是 AI 最擅长的。

加新能力，也只是再多写一个这样的 Markdown 文件而已。这就是”用 Skill 代替代码”的含义。

所以，根本的进步，是执行环境变了，从只能执行代码，到可以执行文本。

这已经成为一种趋势

#

如果只有 Kali Claw 和 Transilience，或许还能说是个例。但当你把视野放宽，会发现”把渗透能力 Skills 化”已经是一条清晰且在加速的路线，参与者横跨社区、顶级安全公司：

Trail of Bits 的 skills 仓库

——这家是业界最受尊敬的安全研究公司之一，他们的 skills 仓库被视为安全向 Skill 的”黄金标准”，4.9k stars，28 个以上的 SKILL.md，覆盖代码审计和静态分析全流程。
awesome-claude-skills-security

——把著名的 SecLists 字典、攻击载荷、webshell 全打包成 Claude Code 的 Skill，还附带 pentest、CTF、bug bounty 几个专家 Agent。
alirezarezvani/claude-skills

——一个 300 多个 Skill 的大集合，其中的安全渗透 Skill 覆盖扫描、密钥检测、报告生成，且能跨多个 AI 编程助理通用。
学术界

也在跟进，虽未看到直接用Skills渗透测试的论文，但已经出现了 EvoSkills、Memento-Skills 这类”自进化 Skill”框架的论文，让 Agent 能够自主生成、迭代优化多文件的技能包，而无需重新训练底层模型。

小结

暂时看，基于Skills的通用工具，在渗透能力上还弱于专用工具，但这使我想起了早期的智能手机和卡片相机的关系，卡片相机能力优于智能手机，但随着手机的进步，卡片相机很快被手机取代。类似的例子很多。

所以，通用工具会逐步取代很多的专用工具。

当然，一些优秀的专用工具仍然会持续发展，一如今天的单反相机，专业的游戏机。

这是趋势的力量。

关联阅读

Strix,融合源码理解与运行态验证的 AI 渗透测试框架

Hexstrike AI在多个工具及模型上的渗透测试表现

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：AI与安全孙志敏孙志敏《AI辅助渗透测试，进化到Skills阶段了》