2026-05-27 05:17:41 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文深入复盘了2025年人工智能领域的关键发展，特别是Anthropic公司如何通过一系列务实创新，在Agent开发领域取得领先。文章分析了五项核心线索：一是模型上下文协议（MCP）如何成为行业通用标准，解决了AI与外部世界的连接难题；二是ClaudeCode和Subagent架构如何实现AI辅助编程从代码补全到复杂任务协作的突破；三是AgentSDK如何简化开发流程，让开发者从底层循环实现转向能力编排；四是ClaudeSkills如何通过一种巧妙的目录结构平衡代码稳定性与提示词灵活性，实现能力的模块化分发；最后，通过对比GoogleA2A协议的宏大愿景与现实困境，凸显了Anthropic自下而上、贴近开发者需求的务实策略最终赢得了市场。结论认为，这些举措共同构成了其定义未来的iPhone时刻，标志着AI正从概念走向基础设施建设的工业时代。 综合评分： 90 文章分类： 技术标准,AI安全,解决方案,产品介绍,WEB安全

cover_image

2025年终复盘：Anthropic 如何定义 Agent 开发的 iPhone 时刻

原创

黑屋Ω号黑屋Ω号

漕河泾小黑屋

2026年1月3日 19:59 上海

在小说阅读器读本章

去阅读

引子

元旦假期，窗外的喧嚣被玻璃轻轻隔开，我在卧室的昏黄灯下，百无聊赖地刷着 X。鼠标像一只谨慎的指针在时间里游走，忽然停在 Anthropic 发布的一条关于 Skills 的推文上——那种把能力拆成文件夹、指令与脚本的朴素方式，像是把复杂的机关分解为可把握的零件，让人忍不住点开、再点开。好奇心驱使我沿着链接一路深入，越看越觉得这设计的简洁和分寸，恰好避开了夸张与花哨，只留下能被复用的秩序与温度。也正是从这里，我开始确信：所谓 Agent 开发的“iPhone 时刻”，不是一场华丽的发布，而是一个简单、务实的标准，沉入每一位开发者的日常，像冰面下的潜流，改写了潮水的方向。

Anthropic 在这一年里，以一种近乎克制的方式，串联起五条关键线索：从模型上下文协议（MCP）成为事实标准，到 Claude Code 与 Subagent 协作范式的重塑；从 Agent SDK 核心循环的开发者心智解放，到 Claude Skills 在能力分发上的崭新路径；最终，在与 Google A2A 宏大叙事的对照中，彰显出一种根植于现实的生长力量。这五条线索交织，描绘出 2025 年这场静默革命的全貌。

共识的基石：MCP 的悄然加冕

在 Agent 概念初生的混沌年代，开发者们正身陷一场无形的“巴别塔”困境。每一个独立的 AI 应用，都像一个说着独特方言的部落，当它试图与外部世界——无论是数据库、API 还是本地文件——沟通时，都必须费力地打造一套专属的“翻译器”，也就是所谓的“胶水代码”。这种 N×M 的集成难题，如同无数重复发明的轮子，极大地消耗着创新的动能。

Anthropic 在 2024 年底悄然发布的模型上下文协议（MCP），正是为终结这场混乱而生。[16] 它的核心思想朴素：一种基于 JSON-RPC 的开放约定，旨在为 AI 的“大脑”与外部的“世界”之间，提供一种统一的对话范式。若将 Agent 喻为一位思考者，MCP 便是它的四肢与感官，让它得以“触摸”数据，“听见”事件，并“操控”工具。

这种设计，对我而言，其精髓并不陌生。它像极了渗透测试初期建立滩头阵地时，所依赖的那种标准化“握手协议”。无论目标系统是 Windows 还是 Linux，是 Web 服务还是桌面应用，一个设计良好的 C2 通道，总能以最少的特征、最通用的方式建立连接，从而让后续的侦察与权限提升变得可能。MCP 的角色与此异曲同工，它不关心工具的具体实现，只关心能否通过一种可预测的方式被“调用”。这种简单性，恰恰是其力量的源泉。

一个标准的成功，不在于其设计的完美无缺，而在于其能否吸引最广泛的“使用者”自发地聚集。2025 年，MCP 的加冕之路，正是由开发者、竞争对手与服务商共同铺就。从微软的 Visual Studio Code 到新兴的 AI 原生 IDE 如 Trae、Cursor，开发者们最常驻留的“阵地”率先拥抱了这套协议。[104]紧接着，行业巨头 OpenAI 做出了一个标志性的决定——在其 Agent SDK 中全面接纳 MCP，用一个统一的接口取代了过去碎片化的插件体系。[53]这无异于宣告，两大阵营就“Agent 如何与世界互动”这一根本问题，达成了停战协议。

当供给与需求两端都开始讲同一种“语言”，一个繁荣的生态便自然而然地涌现。到 2025 年底，从 GitHub 的代码管理，到 Slack 的团队协作，再到国内的飞书、高德地图，数以万计的 MCP Server 如雨后春笋般出现，将真实世界的数字服务源源不断地接入 Agent 的感知范围。[122] [128]

这恰好呼应了 NVIDIA 创始人 Jensen Huang 在去年 12 月初那场关于 AI 领导力的谈话。当被问及 AI 的终局，他并未描绘一个“天网”般的超级智能，而是认为 AI 的最终形态将是成为基础设施 ，如同电力和互联网一样，无声地融入经济与社会的背景之中。MCP 在 2025 年的演进轨迹，正是这一判断的绝佳注脚。它从一个由 Anthropic 发起的提案，最终被捐赠给中立的 Agentic AI 基金会，与 OpenAI、Google、微软等昔日或今日的对手共同管理，完成了从“私有产物”到“公共设施”的蜕变。[15] [128]

它没有强迫任何人，却最终说服了所有人。共识的基石，由此奠定。

“共创”的乐谱：终端与意志的二重奏

如果说 MCP 为 Agent 连接了广阔的外部世界，那么 Claude Code 则将目光投向了更幽深的内部——开发者与代码之间那片充满创造与混沌的场域。它所尝试回答的，是一个更为核心的问题：一个 AI，如何能从一个“代码补全工具”进化为一名真正的“开发搭子”？

2025 年的开发者工具之争，呈现出几种不同的哲学分野。[2] [3]GitHub Copilot 根植于 IDE，像一位时刻待命的副驾驶，擅长在开发者主导的迭代中提供精妙的代码片段。Cursor 则更进一步，试图打造一个“AI 优先”的集成开发环境，将 AI 的能力贯穿于编辑、调试的每个角落。而 Claude Code，则选择了一条看似更为复古，实则更具野心的道路：“终端优先，仓库感知”。

它不再满足于在图形界面中充当一个被动的建议者，而是将自己定位为一个能通过命令行与开发者直接对话、能感知整个代码仓库上下文的“智能协行者”。当接收到“为项目添加 OAuth 登录功能”这样一个略显模糊的指令时，它所展现的，是一种端到端的自主性：规划任务、定位文件、编写新模块、修改旧代码，甚至调用 Git 创建新的分支。这种工作流，与其说是在“辅助”编程，不如说是在进行一场真正的“结对编程”。

这种能力的背后，是一项名为“Subagent”（子智能体）的架构创新。[144]这个概念，如同在一次复杂的渗透测试中，将不同的攻击载荷（payload）封装在各自独立的、一次性的执行环境中。主程序只负责在恰当的时机投递恰当的载荷，而不关心其内部的具体实现。这样做的好处显而易见：

首先是执行的鲁棒性。一个复杂的开发任务，如“生成 API 客户端并编写测试用例”，被拆解成独立的子步骤。任何一个 Subagent 的失败，都像是投入目标网络的一个探测器失联了，它不会污染主任务的状态，主 Agent 可以从容地决定重试、切换备用方案，或是向人类开发者“举手”求助。

其次是上下文的纯净度。让一个单一的 LLM 实例处理所有中间过程的日志与输出，就像在一个狭小的房间里堆满各种工具和半成品，最终会因为混乱而忘记最初的目标。Subagent 架构则为每个子任务提供了隔离的“沙箱”，主 Agent 的“思维链”只保留高层级的战略规划与最终战果，极大地提升了对长线、复杂任务的专注力。[94]

这种“分而治之”的理念，正在成为一种管理 Agent 复杂性的通用范式，并开始被其他工作流自动化平台所借鉴。[87]它标志着 AI 辅助开发，终于从“语句级”的修补，进化到了“建筑级”的共创。

“思考循环”的解放：从实现到编排

当 Agent 拥有了“四肢”（MCP）与“工作方式”（Subagent），如何让每一个普通开发者都能轻松地驾驭这种力量，便成了下一个关键。Anthropic 在 2025 年推出的 Agent SDK，其核心价值便在于此。它为开发者提供了一套开箱即用的“Think–Act–Observe”（思考-行动-观察）循环。[94] [95]

这个循环，是所有智能体与环境交互的本质。在 SDK 出现之前，开发者需要像早期程序员手动管理内存分配一样，亲手构建这个循环的每一个细节：如何将观察到的信息打包成提示词（Think），如何解析模型的指令并执行（Act），又如何捕获行动的结果作为下一次思考的输入（Observe）。这个过程充满了状态管理、错误处理、循环控制等繁琐的工程细节，消耗了开发者大量心力。

Agent SDK 的出现，如同为编程语言引入了垃圾回收机制。它将这个核心循环封装成一个健壮、可配置的控制器，将开发者的角色从“循环的实现者”转变为“能力的编排者”。开发者不再需要关心循环本身如何运转，而是可以将精力聚焦于更高层次的三个问题：我的 Agent 目标是什么？它能使用哪些工具？它应该在何时与我互动？

从一线研发的视角来看，这种转变不仅仅是少写了几行代码。它意味着一种新的开发范式的诞生，一种 Andrej Karpathy 在他 2025 年终总结中提到的，与 LLM 协同的“Vibe Coding”。开发者更多地是在设计工具集、定义 Subagent 的职责、规划上下文的压缩与回滚策略，而不是在琐碎的循环逻辑中挣扎。这种从“实现”到“编排”的跃迁，极大地降低了构建强大 Agent 的心智门槛，也为 AI 在 2025 年的普及铺平了最后一段道路。[145]

智能的封装与分发：代码与提示词的微妙平衡

2025 年 10 月，Anthropic 发布了一项看似微小，却可能比 MCP 协议本身更具深远影响的功能：Claude Skills。它以一种极为巧妙的方式，为 Agent 能力的扩展，在“代码的稳定性”与“提示词的灵活性”这对长期存在的矛盾之间，找到了一个近乎完美的平衡点。

在 Skills 出现之前，赋予 Agent 新能力不外乎两种途径。要么，将其硬编码为一个稳定的工具（如 MCP Server），这足够可靠，但每次迭代都意味着新的部署，显得过于“重”；要么，在提示词中用自然语言细致地描述步骤，这足够灵活，但极不稳定，且极易耗尽宝贵的上下文空间。

Skills 则提供了介于两者之间的第三条路。一个 Skill 的本质，仅仅是一个包含 SKILL.md 文件的目录。[33]这个 Markdown 文件，通过简单的头部元信息（Frontmatter）定义了能力的名称、描述和参数，供 Agent“发现”；而文件的正文，则用自然语言描述了执行该能力的具体步骤。更妙的是，这个目录中还可以包含额外的代码脚本。

正如技术博主 Simon Willison 在其年度回顾中所惊叹的，这种设计的核心魅力在于其“概念上的极致简单”。[78]它带来了一种“渐进式信息披露”的革命性机制：Agent 不再需要一次性将所有能力的细节全部加载到记忆中，它首先只读取元数据，构建一份“能力清单”。[31]只有当它决定使用某个 Skill 时，才会去阅读 SKILL.md 的正文，理解具体步骤。如果步骤中需要执行一段精确的代码，它才会去加载并执行那个脚本文件。

这种“按需加载”的模式，如同一个可插拔的 payload 模块库，极大地缓解了困扰 Agent 的上下文过载问题。同时，它也实现了代码与提示的黄金结合：描述部分是“提示”，给予了 Agent 理解任务的灵活性；而脚本文件是“代码”，保证了关键步骤执行的确定性。这使得 Skill 既易于创建（像写文档一样），又足够可靠。

从能力分发的角度看，Skills 与 MCP 形成了一种绝佳的互补。MCP 更适合那些标准化的、由远端服务提供的“重能力”，如支付、地图查询；而 Skills 则完美契合那些高度个性化的、需要频繁迭代的“轻能力”或工作流编排，如“分析我公司的销售数据并生成周报”。分享一个 Skill，就像分享一个代码仓库一样简单，这为 Agent 能力的模块化与组合，打开了前所未有的想象空间。一个围绕 Skills 的，类似 npm 或 PyPI 的“技能商店”生态，似乎已在地平线上若隐若现。

帝国的迟缓：完美蓝图与现实路径的背离

就在 Anthropic 以一种务实、迭代的方式，自下而上地构筑其标准生态之时，另一边的巨头 Google，则选择了一条截然不同的、自上而下的道路。2025 年 4 月，Google 高调推出了一个宏大而完美的“智能体间通信协议”（Agent2Agent, A2A），试图为所有 Agent 之间的协作，建立一个通用的“世界语”。[70]

其愿景不可谓不宏大，协议设计也堪称周全，涵盖了身份验证、任务描述、安全通信等方方面面。[112]然而，这份精心绘制的“理想城市”蓝图，在现实世界中却遭遇了水土不服。到 2025 年底，除了 Google 自家的云平台和少数合作伙伴的实验性支持外，A2A 并未在广大的开发者社区中激起太多浪花。[115]

究其原因，恰恰在于它的“过度设计”。与 MCP 基于通用协议的简洁性相比，A2A 协议栈显得过于学术化和复杂。一位开发者在社区中的评论一针见血：“我可以用一个下午让我的应用支持 MCP，但理解 A2A 的规范可能就需要一周。”[68]在一个技术迭代以“月”为单位的时代，这种高昂的入门成本，无疑劝退了大量追求敏捷与实效的开发者。

网络效应的建立，往往依赖于最初的引爆点。当 VS Code、Cursor 等中立的开发阵地早已被简单易用的 MCP 占领，当成千上万的开发者已经习惯了通过 Skills 扩展能力时，A2A 作为一个后来者，未能提供一个足够有说服力的理由，让大家放弃已经运转良好的工具链，切换到一条全新的、更陡峭的赛道。

最终，A2A 的喧嚣，逐渐归于沉寂。它并没有错，只是它试图解决的是一个“未来”的完美问题，而 Anthropic 解决的，是“现在”的现实问题。

结语

回顾 2025 年，这场围绕 Agent 标准的无声竞逐，与其说是一场技术路线的对决，不如说是一场开发哲学的较量。Anthropic 的胜利，在于它对技术变革早期节奏的清醒把握，在于它选择了一条更为务实和迭代的道路。

这恰恰印证了微软 CEO Satya Nadella 在岁末展望中所强调的：AI 的焦点，必须从天花乱坠的炒作，果断转向能够交付的真实世界结果。而深度学习的布道者 Andrew Ng 也将 2025 年定义为“AI 工业时代的黎明”，其核心特征便是 AI 正从学术探索，转变为由万亿资本驱动的、类似电力的基础设施建设。

Anthropic 的每一步，都踏在了“基础设施”与“真实结果”的节拍上。它用 MCP 解决了最普遍的连接问题，并迅速将其公共化；用 Claude Code 和 Subagent 打造了足够强大的样板间，展示了 Agent 在复杂场景下的潜力；用 Agent SDK 将创新的门槛降至最低；最后，用 Skills 为生态的自发繁荣埋下了种子。

这些环环相扣的支柱，共同构筑了它在 2025 年引领浪潮的核心竞争力。当标准不再是悬于庙堂的宏大宣告，而是悄然沉入每一位开发者的日常工作流，成为其思考与创造的延伸——这或许，就是属于 Anthropic 的，那个定义未来的“iPhone 时刻”。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：漕河泾小黑屋黑屋Ω号黑屋Ω号《2025年终复盘：Anthropic 如何定义 Agent 开发的 iPhone 时刻》