文章总结: 《御舆:解码AgentHarness》一书深度剖析ClaudeCode架构,通过古代马车制造隐喻系统讲解AgentHarness设计原理。该书将LLM比作骏马,AgentHarness比作承载约束的舆车,涵盖工具系统、权限管线、状态持久化等核心组件。基于公开资料分析AI编程三次浪潮演进,重点阐述自主智能体时代的工程基础设施需求,为架构师和开发者提供完整的架构决策地图与可迁移设计模式。 综合评分: 85 文章分类: 安全开发,技术标准,解决方案,安全工具,AI安全
御舆:解码 Agent Harness
lintsinghua lintsinghua
Zner sec
2026年5月3日 17:00 内蒙古
在小说阅读器读本章
去阅读
Claude Code 架构深度剖析
“一器而工聚焉者,车为多。”——《考工记》 古人御舆,驾驭天地间最精密的机械;今人御舆,驾驭硅基时代最复杂的智能体系统。 不做使用教程,不列 Prompt 技巧——拆解 Agent 的骨架与神经。
两千三百年前,《考工记》的作者写下了这句话。在先秦时代,马车是人类制造过的最复杂的系统工程——没有之一。
造一辆马车需要多少工种?木工造舆(车厢),金工铸軎辖(车轴固定件),皮工制鞁(挽具),漆工饰表面,轮人造辐(车轮辐条)……《考工记》所言”天有时,地有气,材有美,工有巧”,四者合一,方成良车。
这些构件各有深意,且与本书所剖析的 Agent Harness 架构形成了跨越千年的隐喻对应:
孔子以车喻信:”大车无輗,小车无軏,其何以行之哉?”——车少了固定的销钉就无法行驶,正如 Agent 少了权限护栏就不可信赖。《考工记》载”辀欲颀典,辀深则折,浅则负”——车辕的弯曲度必须恰到好处,过深则断、过浅则不堪重负,正如 Agent 的自主性设计必须在能力与安全之间寻找平衡点。
甲骨文中的”舆”字,罗振玉释为”象众手造车之形”——许多双手共同造出一辆车。今天,构建一个生产级 Agent 系统同样需要”众手”:工具系统、权限管线、上下文管理、状态持久化、流式通信、错误恢复……每一个子系统都是一位匠人的手艺,合在一起才能让智能体真正上路。
古人御舆,驾驭天地之间最精密的机械;今人御舆,驾驭硅基时代最复杂的智能体系统。
这就是本书得名 御舆 的由来,也是读者们称之为 舆书 的缘起。
为什么写这本书
AI 编程范式的三次浪潮
回顾过去几年,AI 辅助编程经历了三次清晰的浪潮,每一次都深刻改变了开发者与代码之间的关系:
第一次浪潮(2021-2022):代码补全时代。 GitHub Copilot 的诞生标志着 AI 正式进入开发者的日常工作流。这一阶段的核心范式是”行内补全”——AI 基于当前文件上下文预测下一行或下一个代码块,开发者通过 Tab 键接受建议。这是一种高度被动、高度局部化的辅助模式:AI 看到的是光标前后的几十行代码,输出的是片段级建议。它不会跨文件推理,不会理解项目结构,更不会主动执行操作。
第二次浪潮(2023-2024):对话式助手时代。 随着上下文窗口的扩展和多文件感知能力的出现,AI 工具从”补全框”升级为”对话框”。Cursor、Windsurf、Continue 等编辑器嵌入式工具百花齐放,开发者可以通过自然语言描述需求,AI 跨多个文件生成代码。但这个阶段的 AI 仍然受限于编辑器边界——它能写代码,但不能运行代码;能建议测试,但不能执行测试;能发现问题,但不能修复后验证。开发者在 AI 和终端之间不断切换,充当着人肉”胶水”的角色。
第三次浪潮(2025 至今):自主智能体时代。 我们正在经历的范式转移远比前两次深刻。AI 不再是”坐在编辑器里等你提问的助手”,而是”在终端中自主执行任务的智能体”。它可以直接运行 Shell 命令、读写文件系统、执行测试套件、操作 Git 版本控制——并且在遇到错误时自主调整策略、迭代修复。从简单的代码补全到多文件重构,从单轮问答到跨工具编排,AI 编程助手正在经历一场从 Chatbot 到 Agent 的根本性范式转移。
这三次浪潮可以用一张简明的演进图来概括:
Agent Harness:一个新架构概念的诞生
在这场转移中,一个关键的架构模式浮出水面:Agent Harness——一个围绕 LLM 构建的运行时框架,负责管理工具注册与调度、权限管控、状态持久化、流式输出、错误恢复等横切关注点。
理解 Agent Harness 的最好方式,正是我们在前言开头引入的古代马车类比。LLM 是一个力大无穷却不辨路途的骏马——它有无穷的推理之力,却不知该往何处去、何处该停。Agent Harness 就是为这匹骏马打造的那辆”舆”:工具系统是辐(车轮辐条),将骏马的力量传导到大地;权限管线是軎辖(车轴销钉),确保车轮不脱离轨道;上下文压缩是辕的弹性,在有限空间内承受最大载荷;流式通信是车轮的转动,让一切持续运转。而你——读懂了这套架构的开发者——就是那个御者(车夫)。善御者不造马,亦不造车,但他深谙舆之结构、辔之缓急,所以能驾驭自如。
这个类比揭示了 Agent Harness 的本质:它不是 SDK,不是 API 封装,更不是简单的 prompt engineering,而是一套让 LLM 真正”上路行驶”的工程基础设施。 如果说 LLM 是驱动 Agent 的骏马,那么 Agent Harness 就是那辆舆——承载、约束、传导、协调,缺一不可。
Claude Code 的诞生与意外公开
2025 年初,Anthropic 发布了 Claude Code——一个运行在终端中的 AI 编程智能体。它不依赖特定的编辑器,不依赖图形界面,而是以一种近乎极客的方式直接运行在命令行中。这个选择本身就是一种声明:Agent 不需要 GUI 的束缚,它需要的是一个功能完备的运行时环境。
2026 年 3 月 31 日,一个意外事件将 Claude Code 推上了技术社区的风口浪尖:安全研究员 Chaofan Shou (@Fried_rice) 发现 Anthropic 发布在 npm registry 中的 @anthropic-ai/claude-code 包包含一个 source map 文件。披露推文获得超过 1700 万次浏览,技术社区围绕 Agent 架构展开了前所未有的深入讨论。Anthropic 随后修补了该配置问题。
正是这场讨论让我们意识到:Agent Harness 已经从一个冷门的工程概念变成了整个开发者社区都在关心的话题。但市面上的讨论大多零散、碎片化——有人关注工具调用的设计,有人讨论权限模型,有人分析流式架构,却没有人把这些拼图整合成一幅完整的画面。
这本书试图填补这个空白。我们不依赖任何未授权资料,而是基于 Claude Code 的公开文档、产品行为和社区讨论,系统性地推演和讲解 Agent Harness 的设计原理。
Claude Code 为什么值得深入学习
选择 Claude Code 作为本书的分析对象,并非出于对某个公司的偏好,而是基于几个客观判断:
第一,架构的代表性。 Claude Code 涵盖了 Agent Harness 的所有核心子系统:工具类型系统、权限管线、状态管理、上下文压缩、MCP 协议集成、子智能体调度等。理解了 Claude Code 的架构,就建立了一套可以迁移到任何 Agent 框架的心智模型。
用一个比喻来说:学习 Claude Code 的架构就像古代学徒拆解一辆名匠所造的马车——虽然各家造车各有巧思,但舆、辕、辐、軎辖的基本结构是相通的。掌握了这份”造车图谱”,你就能理解任何 Agent 系统的骨架。
第二,工程决策的可追溯性。 Claude Code 的设计中充满了有意义的工程决策痕迹。例如:
- 为什么对话主循环采用流式异步生成器而非回调或 Promise 链?(答案涉及背压控制、取消传播和可组合性——详见第 2 章)
- 为什么权限系统采用四阶段管线而非简单的黑白名单?(答案涉及纵深防御和关注点分离——详见第 4 章)
- 为什么工具类型设计中包含并发安全和中断行为这样的细粒度控制接口?(答案涉及并行调度策略和用户体验——详见第 3 章)
这些决策背后是对真实生产场景的深刻洞察,远比抽象的架构讨论更有价值。每一个”为什么”的答案都是一堂设计课。
第三,技术栈的现代性。 Claude Code 选择 Bun 作为运行时、React + Ink 渲染终端 UI、Zod v4 做运行时验证、Commander.js 处理 CLI——这些技术选择本身就是一份现代 TypeScript 工程的参考方案。即使你不关心 Agent 架构,单从工程实践的角度看,Claude Code 也值得学习。
第四,规模的参考价值。 作为一个超过 50 万行 TypeScript 代码的项目,Claude Code 展示了如何在大型代码库中维持模块化、可测试性和可扩展性。它的工具类型系统、权限管线和状态管理方案都可以直接应用到你自己的项目中。
读者画像与阅读路径
四类核心读者
本书适合以下读者,每类读者都能从中获得独特的价值:
架构师和技术负责人,正在评估或构建 AI Agent 系统,需要理解 Agent Harness 的设计空间和工程权衡。对于这类读者,本书提供了完整的架构决策地图,帮助你在”自建还是采用框架”、”哪些子系统需要优先投入”等关键问题上做出明智判断。
高级工程师,已经具备 TypeScript/Node.js 经验,希望深入理解如何在 LLM 之上构建可靠的工程系统。对于这类读者,本书中的设计模式(异步生成器循环、分层权限管线、不可变状态管理)可以直接应用到日常工程实践中,即便你当前并不构建 Agent 系统。
AI 应用开发者,不满足于调用 API 的浅层使用,希望掌握工具调用、流式处理、权限管控等核心技术。对于这类读者,本书从”为什么”到”怎么做”的系统性讲解将帮助你从 API 调用者成长为系统构建者。
对 Agent 技术有好奇心的研究者,希望从工程实现的角度理解 Agent 系统的运作方式。对于这类读者,本书提供了从宏观架构到微观实现的完整视图,填补了学术论文与工程实践之间的认知空白。
阅读路径建议
本书分为四个部分,按照从宏观到微观、从概念到实现的组织方式:
如果你时间有限(快速路径): 至少阅读第 1 章(建立心智模型)和第 2 章(理解核心循环),然后用 15 分钟浏览第 3-4 章的关键要点部分。这两章是理解后续所有内容的基础。
如果你是有经验的工程师(深度路径): 可以直接从第二部分开始,遇到概念缺口时再回溯第一部分的对应章节。重点关注每章的”设计决策分析”小节,这些是对你日常工程实践最有启发的部分。
如果你是初学者(完整路径): 建议按顺序阅读,每章的实战练习都值得动手完成。这些练习设计为层层递进——第 1 章的安装诊断是第 2 章追踪工具调用流的前提,第 3 章的自定义工具练习为第 4 章的权限配置打下基础。
如果你是架构师(评估路径): 重点阅读第 1 章(架构全景)、第 2 章(核心循环设计)和第 4 章(权限管线),然后直接跳到第四部分。这种路径帮助你在最短时间内评估 Agent Harness 的设计空间和工程复杂度。
关于本书
本书基于对 Claude Code 产品架构的深度分析,结合公开文档、社区讨论和产品行为,系统讲解其设计哲学与 Agent Harness 最佳实践。本书的分析方法为:从 Claude Code 的可观测行为出发,结合 Anthropic 官方文档和社区公开讨论,推演和还原其架构设计原理。
《御舆:解码 Agent Harness》42万字拆解 AI Agent 的Harness骨架与神经 —— Claude Code 架构深度剖析,15 章从对话循环到构建你自己的 Agent Harness。在线阅读网站:
lintsinghua.github.io
https://lintsinghua.github.io/
PS:本文单纯分享书籍!
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:Zner sec lintsinghua lintsinghua《御舆:解码 Agent Harness》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。








评论