2026-02-08 00:58:12 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文系统分析了AI智能体的多维攻击面，涵盖MCPServer越权与RCE、SKILLS供应链投毒、FunctionCalling权限逃逸、模型诱导型客户端攻击、沙盒绕过、Workflow编排漏洞及RAG知识库投毒等七大维度。攻击者可形成连锁攻击链，从供应链污染到权限提升最终实现持久化控制。防御需建立全链路信任重构，对模型输入输出、工具调用及外部生态进行严格安全管控。 综合评分： 85 文章分类： AI安全,漏洞分析,安全建设,应用安全,供应链安全

cover_image

AI智能体攻击面的构成与威胁分析

锦岳智慧

2026年2月6日 18:14 北京

AI智能体的攻击面是一个融合了传统应用安全漏洞（如RCE、SSRF）、新型人机交互漏洞（如提示词注入）和供应链安全的复杂立体图景。防御者必须建立新的安全范式，对模型输入输出、工具调用、外部生态（如MCP、SKILLS）进行全链路的信任重构和严格的安全管控。

下表汇总了其主要攻击维度、攻击方法和潜在影响等。

一、MCP Server 攻击

MCP动态引入外部工具的特性在增强能力的同时，也显著扩大了攻击面。针对MCP Server的风险如下。

越权攻击：因授权机制不完善，可能导致低权限用户通过MCP服务器非法访问高敏感资源，产生“权限提升”或“混淆代理”风险。一个本应只有低权限的用户，可能通过MCP服务器访问到本无权访问的高敏感资源。

配置不当导致RCE：攻击者通过控制MCP Server的配置文件（如JSON）路径或内容，可实现远程代码执行。

供应链投毒：MCP生态依赖大量第三方服务器和代码包。攻击者通过劫持流行软件包或发布仿冒包（如伪装mcp-server-github），诱导用户安装恶意版本，从而植入后门。

二、SKILLS 攻击

SKILLS作为AI智能体的能力封装机制，通过提示词和脚本的组合实现任务自动化。但其架构依赖文件加载与上下文注入，缺乏统一安全验证，导致供应链成为主要攻击入口。主要风险如下：

供应链攻击：攻击者通过依赖混淆（如伪造相似包名）、Typosquatting（域名抢注）、托管平台入侵或开发工具投毒等方式，污染SKILLS的分发渠道。例如，在GitHub等平台上传恶意SKILLS，利用用户信任进行传播。一旦SKILLS被污染，恶意成分会随加载过程进入系统，导致agent行为异常或执行未授权操作。

恶意代码嵌入：攻击者篡改SKILL.md文件中的提示词内容，注入恶意指令（如越狱攻击或误导性引导）。例如，在天气查询SKILL的提示词中添加隐蔽指令，Agent被诱导执行不安全任务，如泄露敏感信息或绕过权限控制。

三、Function Calling 攻击

这是最直接且高风险的一类攻击，核心问题在于权限控制不严和执行设计不安全。主要威胁如下。

未授权任意文件读取：智能体被诱导调用文件读取功能，但未对其可访问的路径进行严格限制，导致系统敏感文件（如/etc/passwd）被读取。这并非模型“幻觉”，而是真实的功能调用漏洞。

命令执行授权逃逸：通过构造特殊指令（如find . -name * -exec…），绕过权限约束，实现任意命令执行。

四、模型诱导型客户端攻击

攻击者并不直接攻击模型，通过间接提示词注入实现攻击传递，“教唆”agent去攻击用户。威胁如下：

在输入中插入Markdown语法的图片链接或HTML标签（如 “）。模型在响应时，可能会解析这些语法并主动请求该链接。攻击者通过日志即可获取用户的IP、User-Agent等信息。也可结合结合未授权文件读取，诱导用户点击恶意链接或泄露敏感信息。

五、代码解释器：沙盒绕过

代码解释器为模型提供了强大的执行能力，但一旦沙盒被绕过，后果严重。

攻击场景：沙盒的执行逻辑存在缺陷，允许通过命令拼接来执行任意系统命令。

攻击链：诱导模型执行恶意命令 → 模型在沙盒中执行 → 恶意命令逃逸至宿主机 → 实现对整个服务器的控制。

六、Workflow 编排攻击

Workflow（工作流）是AI智能体为完成一个复杂目标，而自动规划和执行的一系列步骤。危险就藏在智能体对用户输入的信任和工具调用的动态性中。攻击者可以尝试篡改输入，通过参数输入触发服务器端模板注入（SSTI）或内网探测（SSRF）影响编排逻辑，从而让智能体去调用不该调用的工具，或传递恶意参数，导致服务端被控制或内网信息泄露。

七、RAG 攻击

攻击手法：通过知识库投毒污染模型知识源。

潜在影响：导致模型输出偏见或错误信息，影响决策可靠性。

总结

上述攻击面并非孤立存在，而是可能形成连锁攻击链。例如：供应链投毒可能导致恶意SKILLS被加载；通过提示词注入诱导模型触发Function Calling漏洞；利用沙盒绕过实现持久化控制。这种多维风险叠加，使得单一漏洞的危害被显著放大。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：锦岳智慧《AI智能体攻击面的构成与威胁分析》