这次泄露里暴露出来的ClaudeCode架构(Agent+Tool+Prompt)到底是怎么设计的

admin 2026-04-02 04:09:37 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本文深入剖析了ClaudeCode的架构设计,揭示其并非简单依赖强大模型,而是一个将LLM包装成可执行软件工程系统的典型AI编程代理。其核心由Agent主循环、Tool系统、Prompt框架和上下文管理等构成,并具备任务拆解和错误恢复机制,体现了AICodingAgent领域已收敛的标准范式。 综合评分: 85 文章分类: AI安全,代码审计,技术标准,解决方案,应用安全


cover_image

这次泄露里暴露出来的Claude Code 架构(Agent + Tool + Prompt)到底是怎么设计的

王慧敏 王慧敏

AI与代码安全

2026年3月31日 20:48 北京

这部分才是这次事件真正“有含金量”的地方:不是源码本身,而是它暴露了 Claude Code 的 Agent 架构范式。我给你拆成一个比较清晰的工程视角来看。

一、整体架构一句话

Claude Code 的核心可以抽象为:

LLM(Claude) + Agent Loop + Tool System + Prompt Scaffold

也就是一个典型的「AI 编程代理(Coding Agent)」系统。

二、Agent 主循环(核心骨架)

泄露代码显示,它是一个非常标准的 ReAct / Tool-using Agent Loop

2.1 核心流程大概是:

| | | — | | 用户输入    ↓ 构造 Prompt(上下文 + 指令)    ↓ 调用 Claude 模型    ↓ 解析输出(判断是否调用工具)    ↓ 执行 Tool(如读文件 / 写代码 / 执行命令)    ↓ 把结果回填到上下文    ↓ 继续下一轮 |

本质就是一个循环:

| | | — | | while (not_done):     think → act → observe |

这其实和学术里的:

1)ReAct

2)Toolformer

是一脉相承的。

三、Tool 系统设计(重点)

Claude Code 的 Tool 设计是这次泄露里最值得看的部分之一。

3.1 Tool 抽象结构

每个工具基本是:

| | | — | | TypeScript {   name: “read_file”,   description: “…”,   input_schema: {…},   execute: async () => {…} } |

特点:

1)强 schema(类似 JSON Schema)

2)明确输入输出

3)可被模型调用

3.2 工具类型(从泄露内容推测)

主要分几类:

3.2.1 文件系统类

1)read_file

2)write_file

3)list_directory

用于代码理解 / 修改

3.2.2 执行类

1)run_command(执行 shell)

2)run_tests

让 AI 能“验证代码”

3.2.3分析类

1)search

2)grep / symbol 查找

用于大项目导航

3,2,4任务类(高层)

1)plan_task

2)apply_patch

这类工具其实已经接近“子 Agent”

3.3 Tool 调用方式

模型不会直接输出自然语言,而是类似:

| | | — | | Josn {   “tool”: “read_file”,   “arguments”: {     “path”: “src/app.js”   } } |

然后系统:

1)解析 JSON

2)调用工具

3)把结果喂回模型

四、Prompt Scaffold(真正的“灵魂”)

这是很多人低估的部分,但其实是核心竞争力之一。

Claude Code 的 Prompt 不是简单一句话,而是:

4.1多层结构 Prompt

大致结构:

| | | — | | [System Prompt]   – 你是一个代码助手   – 你可以使用工具   – 必须遵循格式   [Tool Definitions]   – 每个工具的说明 + schema   [User Input]   [Context]   – 当前文件   – 历史操作   – 命令输出   [Instructions]   – 输出必须是 JSON / Tool call |

4.2强约束输出格式

比如:

1)必须输出 JSON

2)不允许随便解释

3)必须选择 tool 或直接回答

这解决了 LLM 的两个问题:

1)幻觉

2)不可控输出

4.3 Planning 提示(关键)

泄露中一个很关键的点是:

模型会被引导:

1)先思考(plan)

2)再执行(act)

类似:

| | | — | | You should think step by step. Decide whether to use a tool. |

五、上下文管理(Context Engineering)

这是工程上非常关键但容易被忽略的点。

Claude Code 做了几件事:

5.1滚动上下文(Sliding Window)

1)保留最近操作

2)丢弃过旧内容

5.2结构化上下文

不是简单拼接,而是:

| | | — | | [File Content] [Previous Tool Output] [Errors] |

让模型更容易理解

5.3关键状态注入

比如:

1)当前工作目录

2)Git 状态

3)失败日志

六、任务拆解(Mini-Agent 结构)

泄露中可以看到一种趋势:

Claude Code 不只是一个 Agent,而是:Agent + 子任务执行器(pseudo multi-agent)

例如:

6.1一个复杂任务:“修复测试失败”

会被拆成:

1.找失败测试

2.读代码

3.分析原因

4.修改代码

5.重新运行测试

每一步其实都像一个“小 Agent 行为”

七、错误恢复机制(很工程化)

Claude Code 有明显的“自愈能力”设计:

7.1 当出错时:

1)重新调用模型

2)注入错误信息:

| | | — | | The previous command failed with: … Fix the issue. |

这就是 AI 能不断迭代修复代码的关键

八、和其它 Coding Agent 的对比

你可以把它和几个东西对标:

1)GitHub Copilot

2)OpenAI Codex

3)AutoGPT

Claude Code 的特点是:

更工程化,而不是更“智能”

具体表现:

1)Tool schema 很严格

2)Prompt 控制非常强

3)CLI 深度集成开发环境

九、核心洞察总结

这次泄露最重要的不是“代码”,而是验证了一件事:

9.1 AI Coding Agent 的标准范式已经收敛了:

1. Agent Loop(ReAct)

2. Tool 调用(结构化)

3. Prompt Scaffold(强约束)

4. Context Engineering(上下文管理)

5. Error Recovery(自修复)

十、总结

Claude Code 本质不是“更强的模型”,而是把 LLM 包装成一个可执行的软件工程系统

  【AI代码助手、大模型智能体安全、AI代码静态分析工具、AI动态分析工具、AI渗透测试工具、AI模糊测试、AI恶意代码检测平台、AI软件漏洞挖掘平台、AI软件供应链安全平台。试用及合作请后台私信工程师13381155803(微信同步)】


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:AI与代码安全 王慧敏 王慧敏《这次泄露里暴露出来的Claude Code 架构(Agent + Tool + Prompt)到底是怎么设计的》

评论:0   参与:  0