2026-04-02 04:09:37 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文深入剖析了ClaudeCode的架构设计，揭示其并非简单依赖强大模型，而是一个将LLM包装成可执行软件工程系统的典型AI编程代理。其核心由Agent主循环、Tool系统、Prompt框架和上下文管理等构成，并具备任务拆解和错误恢复机制，体现了AICodingAgent领域已收敛的标准范式。 综合评分： 85 文章分类： AI安全,代码审计,技术标准,解决方案,应用安全

cover_image

这次泄露里暴露出来的Claude Code 架构（Agent + Tool + Prompt）到底是怎么设计的

王慧敏王慧敏

AI与代码安全

2026年3月31日 20:48 北京

这部分才是这次事件真正“有含金量”的地方：不是源码本身，而是它暴露了 Claude Code 的 Agent 架构范式。我给你拆成一个比较清晰的工程视角来看。

一、整体架构一句话

Claude Code 的核心可以抽象为：

LLM（Claude） + Agent Loop + Tool System + Prompt Scaffold

也就是一个典型的「AI 编程代理（Coding Agent）」系统。

二、Agent 主循环（核心骨架）

泄露代码显示，它是一个非常标准的 ReAct / Tool-using Agent Loop：

2.1 核心流程大概是：

| | | — | | 用户输入 ↓ 构造 Prompt（上下文 + 指令） ↓ 调用 Claude 模型 ↓ 解析输出（判断是否调用工具） ↓ 执行 Tool（如读文件 / 写代码 / 执行命令） ↓ 把结果回填到上下文 ↓ 继续下一轮 |

本质就是一个循环：

| | | — | | while (not_done): think → act → observe |

这其实和学术里的：

1）ReAct

2）Toolformer

是一脉相承的。

三、Tool 系统设计（重点）

Claude Code 的 Tool 设计是这次泄露里最值得看的部分之一。

3.1 Tool 抽象结构

每个工具基本是：

| | | — | | TypeScript { name: “read_file”, description: “…”, input_schema: {…}, execute: async () => {…} } |

特点：

1）强 schema（类似 JSON Schema）

2）明确输入输出

3）可被模型调用

3.2 工具类型（从泄露内容推测）

主要分几类：

3.2.1 文件系统类

1）read_file

2）write_file

3）list_directory

用于代码理解 / 修改

3.2.2 执行类

1）run_command（执行 shell）

2）run_tests

让 AI 能“验证代码”

3.2.3分析类

1）search

2）grep / symbol 查找

用于大项目导航

3，2，4任务类（高层）

1）plan_task

2）apply_patch

这类工具其实已经接近“子 Agent”

3.3 Tool 调用方式

模型不会直接输出自然语言，而是类似：

| | | — | | Josn { “tool”: “read_file”, “arguments”: { “path”: “src/app.js” } } |

然后系统：

1）解析 JSON

2）调用工具

3）把结果喂回模型

四、Prompt Scaffold（真正的“灵魂”）

这是很多人低估的部分，但其实是核心竞争力之一。

Claude Code 的 Prompt 不是简单一句话，而是：

4.1多层结构 Prompt

大致结构：

| | | — | | [System Prompt] – 你是一个代码助手 – 你可以使用工具 – 必须遵循格式 [Tool Definitions] – 每个工具的说明 + schema [User Input] [Context] – 当前文件 – 历史操作 – 命令输出 [Instructions] – 输出必须是 JSON / Tool call |

4.2强约束输出格式

比如：

1）必须输出 JSON

2）不允许随便解释

3）必须选择 tool 或直接回答

这解决了 LLM 的两个问题：

1）幻觉

2）不可控输出

4.3 Planning 提示（关键）

泄露中一个很关键的点是：

模型会被引导：

1）先思考（plan）

2）再执行（act）

类似：

| | | — | | You should think step by step. Decide whether to use a tool. |

五、上下文管理（Context Engineering）

这是工程上非常关键但容易被忽略的点。

Claude Code 做了几件事：

5.1滚动上下文（Sliding Window）

1）保留最近操作

2）丢弃过旧内容

5.2结构化上下文

不是简单拼接，而是：

| | | — | | [File Content] [Previous Tool Output] [Errors] |

让模型更容易理解

5.3关键状态注入

比如：

1）当前工作目录

2）Git 状态

3）失败日志

六、任务拆解（Mini-Agent 结构）

泄露中可以看到一种趋势：

Claude Code 不只是一个 Agent，而是：Agent + 子任务执行器（pseudo multi-agent）

例如：

6.1一个复杂任务：“修复测试失败”

会被拆成：

1.找失败测试

2.读代码

3.分析原因

4.修改代码

5.重新运行测试

每一步其实都像一个“小 Agent 行为”

七、错误恢复机制（很工程化）

Claude Code 有明显的“自愈能力”设计：

7.1 当出错时：

1）重新调用模型

2）注入错误信息：

| | | — | | The previous command failed with: … Fix the issue. |

这就是 AI 能不断迭代修复代码的关键

八、和其它 Coding Agent 的对比

你可以把它和几个东西对标：

1）GitHub Copilot

2）OpenAI Codex

3）AutoGPT

Claude Code 的特点是：

更工程化，而不是更“智能”

具体表现：

1）Tool schema 很严格

2）Prompt 控制非常强

3）CLI 深度集成开发环境

九、核心洞察总结

这次泄露最重要的不是“代码”，而是验证了一件事：

9.1 AI Coding Agent 的标准范式已经收敛了：

1. Agent Loop（ReAct）

2. Tool 调用（结构化）

3. Prompt Scaffold（强约束）

4. Context Engineering（上下文管理）

5. Error Recovery（自修复）

十、总结

Claude Code 本质不是“更强的模型”，而是把 LLM 包装成一个可执行的软件工程系统。

【AI代码助手、大模型智能体安全、AI代码静态分析工具、AI动态分析工具、AI渗透测试工具、AI模糊测试、AI恶意代码检测平台、AI软件漏洞挖掘平台、AI软件供应链安全平台。试用及合作请后台私信工程师13381155803（微信同步）】

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：AI与代码安全王慧敏王慧敏《这次泄露里暴露出来的Claude Code 架构（Agent + Tool + Prompt）到底是怎么设计的》