2025年终复盘:Anthropic如何定义Agent开发的iPhone时刻

admin 2026-05-27 05:17:41 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本文深入复盘了2025年人工智能领域的关键发展,特别是Anthropic公司如何通过一系列务实创新,在Agent开发领域取得领先。文章分析了五项核心线索:一是模型上下文协议(MCP)如何成为行业通用标准,解决了AI与外部世界的连接难题;二是ClaudeCode和Subagent架构如何实现AI辅助编程从代码补全到复杂任务协作的突破;三是AgentSDK如何简化开发流程,让开发者从底层循环实现转向能力编排;四是ClaudeSkills如何通过一种巧妙的目录结构平衡代码稳定性与提示词灵活性,实现能力的模块化分发;最后,通过对比GoogleA2A协议的宏大愿景与现实困境,凸显了Anthropic自下而上、贴近开发者需求的务实策略最终赢得了市场。结论认为,这些举措共同构成了其定义未来的iPhone时刻,标志着AI正从概念走向基础设施建设的工业时代。 综合评分: 90 文章分类: 技术标准,AI安全,解决方案,产品介绍,WEB安全


cover_image

2025年终复盘:Anthropic 如何定义 Agent 开发的 iPhone 时刻

原创

黑屋Ω号 黑屋Ω号

漕河泾小黑屋

2026年1月3日 19:59 上海

在小说阅读器读本章

去阅读

引子

元旦假期,窗外的喧嚣被玻璃轻轻隔开,我在卧室的昏黄灯下,百无聊赖地刷着 X。鼠标像一只谨慎的指针在时间里游走,忽然停在 Anthropic 发布的一条关于 Skills 的推文上——那种把能力拆成文件夹、指令与脚本的朴素方式,像是把复杂的机关分解为可把握的零件,让人忍不住点开、再点开。好奇心驱使我沿着链接一路深入,越看越觉得这设计的简洁和分寸,恰好避开了夸张与花哨,只留下能被复用的秩序与温度。也正是从这里,我开始确信:所谓 Agent 开发的“iPhone 时刻”,不是一场华丽的发布,而是一个简单、务实的标准,沉入每一位开发者的日常,像冰面下的潜流,改写了潮水的方向。

Anthropic 在这一年里,以一种近乎克制的方式,串联起五条关键线索:从模型上下文协议(MCP)成为事实标准,到 Claude Code 与 Subagent 协作范式的重塑;从 Agent SDK 核心循环的开发者心智解放,到 Claude Skills 在能力分发上的崭新路径;最终,在与 Google A2A 宏大叙事的对照中,彰显出一种根植于现实的生长力量。这五条线索交织,描绘出 2025 年这场静默革命的全貌。

共识的基石:MCP 的悄然加冕

在 Agent 概念初生的混沌年代,开发者们正身陷一场无形的“巴别塔”困境。每一个独立的 AI 应用,都像一个说着独特方言的部落,当它试图与外部世界——无论是数据库、API 还是本地文件——沟通时,都必须费力地打造一套专属的“翻译器”,也就是所谓的“胶水代码”。这种 N×M 的集成难题,如同无数重复发明的轮子,极大地消耗着创新的动能。

Anthropic 在 2024 年底悄然发布的模型上下文协议(MCP),正是为终结这场混乱而生。[16] 它的核心思想朴素:一种基于 JSON-RPC 的开放约定,旨在为 AI 的“大脑”与外部的“世界”之间,提供一种统一的对话范式。若将 Agent 喻为一位思考者,MCP 便是它的四肢与感官,让它得以“触摸”数据,“听见”事件,并“操控”工具。

这种设计,对我而言,其精髓并不陌生。它像极了渗透测试初期建立滩头阵地时,所依赖的那种标准化“握手协议”。无论目标系统是 Windows 还是 Linux,是 Web 服务还是桌面应用,一个设计良好的 C2 通道,总能以最少的特征、最通用的方式建立连接,从而让后续的侦察与权限提升变得可能。MCP 的角色与此异曲同工,它不关心工具的具体实现,只关心能否通过一种可预测的方式被“调用”。这种简单性,恰恰是其力量的源泉。

一个标准的成功,不在于其设计的完美无缺,而在于其能否吸引最广泛的“使用者”自发地聚集。2025 年,MCP 的加冕之路,正是由开发者、竞争对手与服务商共同铺就。从微软的 Visual Studio Code 到新兴的 AI 原生 IDE 如 Trae、Cursor,开发者们最常驻留的“阵地”率先拥抱了这套协议。[104]紧接着,行业巨头 OpenAI 做出了一个标志性的决定——在其 Agent SDK 中全面接纳 MCP,用一个统一的接口取代了过去碎片化的插件体系。[53]这无异于宣告,两大阵营就“Agent 如何与世界互动”这一根本问题,达成了停战协议。

当供给与需求两端都开始讲同一种“语言”,一个繁荣的生态便自然而然地涌现。到 2025 年底,从 GitHub 的代码管理,到 Slack 的团队协作,再到国内的飞书、高德地图,数以万计的 MCP Server 如雨后春笋般出现,将真实世界的数字服务源源不断地接入 Agent 的感知范围。[122] [128]

这恰好呼应了 NVIDIA 创始人 Jensen Huang 在去年 12 月初那场关于 AI 领导力的谈话。当被问及 AI 的终局,他并未描绘一个“天网”般的超级智能,而是认为 AI 的最终形态将是成为基础设施 ,如同电力和互联网一样,无声地融入经济与社会的背景之中。MCP 在 2025 年的演进轨迹,正是这一判断的绝佳注脚。它从一个由 Anthropic 发起的提案,最终被捐赠给中立的 Agentic AI 基金会,与 OpenAI、Google、微软等昔日或今日的对手共同管理,完成了从“私有产物”到“公共设施”的蜕变。[15] [128]

它没有强迫任何人,却最终说服了所有人。共识的基石,由此奠定。

“共创”的乐谱:终端与意志的二重奏

如果说 MCP 为 Agent 连接了广阔的外部世界,那么 Claude Code 则将目光投向了更幽深的内部——开发者与代码之间那片充满创造与混沌的场域。它所尝试回答的,是一个更为核心的问题:一个 AI,如何能从一个“代码补全工具”进化为一名真正的“开发搭子”?

2025 年的开发者工具之争,呈现出几种不同的哲学分野。[2] [3]GitHub Copilot 根植于 IDE,像一位时刻待命的副驾驶,擅长在开发者主导的迭代中提供精妙的代码片段。Cursor 则更进一步,试图打造一个“AI 优先”的集成开发环境,将 AI 的能力贯穿于编辑、调试的每个角落。而 Claude Code,则选择了一条看似更为复古,实则更具野心的道路:“终端优先,仓库感知”。

它不再满足于在图形界面中充当一个被动的建议者,而是将自己定位为一个能通过命令行与开发者直接对话、能感知整个代码仓库上下文的“智能协行者”。当接收到“为项目添加 OAuth 登录功能”这样一个略显模糊的指令时,它所展现的,是一种端到端的自主性:规划任务、定位文件、编写新模块、修改旧代码,甚至调用 Git 创建新的分支。这种工作流,与其说是在“辅助”编程,不如说是在进行一场真正的“结对编程”。

这种能力的背后,是一项名为“Subagent”(子智能体)的架构创新。[144]这个概念,如同在一次复杂的渗透测试中,将不同的攻击载荷(payload)封装在各自独立的、一次性的执行环境中。主程序只负责在恰当的时机投递恰当的载荷,而不关心其内部的具体实现。这样做的好处显而易见:

首先是执行的鲁棒性。一个复杂的开发任务,如“生成 API 客户端并编写测试用例”,被拆解成独立的子步骤。任何一个 Subagent 的失败,都像是投入目标网络的一个探测器失联了,它不会污染主任务的状态,主 Agent 可以从容地决定重试、切换备用方案,或是向人类开发者“举手”求助。

其次是上下文的纯净度。让一个单一的 LLM 实例处理所有中间过程的日志与输出,就像在一个狭小的房间里堆满各种工具和半成品,最终会因为混乱而忘记最初的目标。Subagent 架构则为每个子任务提供了隔离的“沙箱”,主 Agent 的“思维链”只保留高层级的战略规划与最终战果,极大地提升了对长线、复杂任务的专注力。[94]

这种“分而治之”的理念,正在成为一种管理 Agent 复杂性的通用范式,并开始被其他工作流自动化平台所借鉴。[87]它标志着 AI 辅助开发,终于从“语句级”的修补,进化到了“建筑级”的共创。

“思考循环”的解放:从实现到编排

当 Agent 拥有了“四肢”(MCP)与“工作方式”(Subagent),如何让每一个普通开发者都能轻松地驾驭这种力量,便成了下一个关键。Anthropic 在 2025 年推出的 Agent SDK,其核心价值便在于此。它为开发者提供了一套开箱即用的“Think–Act–Observe”(思考-行动-观察)循环。[94] [95]

这个循环,是所有智能体与环境交互的本质。在 SDK 出现之前,开发者需要像早期程序员手动管理内存分配一样,亲手构建这个循环的每一个细节:如何将观察到的信息打包成提示词(Think),如何解析模型的指令并执行(Act),又如何捕获行动的结果作为下一次思考的输入(Observe)。这个过程充满了状态管理、错误处理、循环控制等繁琐的工程细节,消耗了开发者大量心力。

Agent SDK 的出现,如同为编程语言引入了垃圾回收机制。它将这个核心循环封装成一个健壮、可配置的控制器,将开发者的角色从“循环的实现者”转变为“能力的编排者”。开发者不再需要关心循环本身如何运转,而是可以将精力聚焦于更高层次的三个问题:我的 Agent 目标是什么?它能使用哪些工具?它应该在何时与我互动?

从一线研发的视角来看,这种转变不仅仅是少写了几行代码。它意味着一种新的开发范式的诞生,一种 Andrej Karpathy 在他 2025 年终总结中提到的,与 LLM 协同的“Vibe Coding”。开发者更多地是在设计工具集、定义 Subagent 的职责、规划上下文的压缩与回滚策略,而不是在琐碎的循环逻辑中挣扎。这种从“实现”到“编排”的跃迁,极大地降低了构建强大 Agent 的心智门槛,也为 AI 在 2025 年的普及铺平了最后一段道路。[145]

智能的封装与分发:代码与提示词的微妙平衡

2025 年 10 月,Anthropic 发布了一项看似微小,却可能比 MCP 协议本身更具深远影响的功能:Claude Skills。它以一种极为巧妙的方式,为 Agent 能力的扩展,在“代码的稳定性”与“提示词的灵活性”这对长期存在的矛盾之间,找到了一个近乎完美的平衡点。

在 Skills 出现之前,赋予 Agent 新能力不外乎两种途径。要么,将其硬编码为一个稳定的工具(如 MCP Server),这足够可靠,但每次迭代都意味着新的部署,显得过于“重”;要么,在提示词中用自然语言细致地描述步骤,这足够灵活,但极不稳定,且极易耗尽宝贵的上下文空间。

Skills 则提供了介于两者之间的第三条路。一个 Skill 的本质,仅仅是一个包含 SKILL.md 文件的目录。[33]这个 Markdown 文件,通过简单的头部元信息(Frontmatter)定义了能力的名称、描述和参数,供 Agent“发现”;而文件的正文,则用自然语言描述了执行该能力的具体步骤。更妙的是,这个目录中还可以包含额外的代码脚本。

正如技术博主 Simon Willison 在其年度回顾中所惊叹的,这种设计的核心魅力在于其“概念上的极致简单”。[78]它带来了一种“渐进式信息披露”的革命性机制:Agent 不再需要一次性将所有能力的细节全部加载到记忆中,它首先只读取元数据,构建一份“能力清单”。[31]只有当它决定使用某个 Skill 时,才会去阅读 SKILL.md 的正文,理解具体步骤。如果步骤中需要执行一段精确的代码,它才会去加载并执行那个脚本文件。

这种“按需加载”的模式,如同一个可插拔的 payload 模块库,极大地缓解了困扰 Agent 的上下文过载问题。同时,它也实现了代码与提示的黄金结合:描述部分是“提示”,给予了 Agent 理解任务的灵活性;而脚本文件是“代码”,保证了关键步骤执行的确定性。这使得 Skill 既易于创建(像写文档一样),又足够可靠。

从能力分发的角度看,Skills 与 MCP 形成了一种绝佳的互补。MCP 更适合那些标准化的、由远端服务提供的“重能力”,如支付、地图查询;而 Skills 则完美契合那些高度个性化的、需要频繁迭代的“轻能力”或工作流编排,如“分析我公司的销售数据并生成周报”。分享一个 Skill,就像分享一个代码仓库一样简单,这为 Agent 能力的模块化与组合,打开了前所未有的想象空间。一个围绕 Skills 的,类似 npm 或 PyPI 的“技能商店”生态,似乎已在地平线上若隐若现。

帝国的迟缓:完美蓝图与现实路径的背离

就在 Anthropic 以一种务实、迭代的方式,自下而上地构筑其标准生态之时,另一边的巨头 Google,则选择了一条截然不同的、自上而下的道路。2025 年 4 月,Google 高调推出了一个宏大而完美的“智能体间通信协议”(Agent2Agent, A2A),试图为所有 Agent 之间的协作,建立一个通用的“世界语”。[70]

其愿景不可谓不宏大,协议设计也堪称周全,涵盖了身份验证、任务描述、安全通信等方方面面。[112]然而,这份精心绘制的“理想城市”蓝图,在现实世界中却遭遇了水土不服。到 2025 年底,除了 Google 自家的云平台和少数合作伙伴的实验性支持外,A2A 并未在广大的开发者社区中激起太多浪花。[115]

究其原因,恰恰在于它的“过度设计”。与 MCP 基于通用协议的简洁性相比,A2A 协议栈显得过于学术化和复杂。一位开发者在社区中的评论一针见血:“我可以用一个下午让我的应用支持 MCP,但理解 A2A 的规范可能就需要一周。”[68]在一个技术迭代以“月”为单位的时代,这种高昂的入门成本,无疑劝退了大量追求敏捷与实效的开发者。

网络效应的建立,往往依赖于最初的引爆点。当 VS Code、Cursor 等中立的开发阵地早已被简单易用的 MCP 占领,当成千上万的开发者已经习惯了通过 Skills 扩展能力时,A2A 作为一个后来者,未能提供一个足够有说服力的理由,让大家放弃已经运转良好的工具链,切换到一条全新的、更陡峭的赛道。

最终,A2A 的喧嚣,逐渐归于沉寂。它并没有错,只是它试图解决的是一个“未来”的完美问题,而 Anthropic 解决的,是“现在”的现实问题。

结语

回顾 2025 年,这场围绕 Agent 标准的无声竞逐,与其说是一场技术路线的对决,不如说是一场开发哲学的较量。Anthropic 的胜利,在于它对技术变革早期节奏的清醒把握,在于它选择了一条更为务实和迭代的道路。

这恰恰印证了微软 CEO Satya Nadella 在岁末展望中所强调的:AI 的焦点,必须从天花乱坠的炒作,果断转向能够交付的真实世界结果。 而深度学习的布道者 Andrew Ng 也将 2025 年定义为“AI 工业时代的黎明”,其核心特征便是 AI 正从学术探索,转变为由万亿资本驱动的、类似电力的基础设施建设。

Anthropic 的每一步,都踏在了“基础设施”与“真实结果”的节拍上。它用 MCP 解决了最普遍的连接问题,并迅速将其公共化;用 Claude Code 和 Subagent 打造了足够强大的样板间,展示了 Agent 在复杂场景下的潜力;用 Agent SDK 将创新的门槛降至最低;最后,用 Skills 为生态的自发繁荣埋下了种子。

这些环环相扣的支柱,共同构筑了它在 2025 年引领浪潮的核心竞争力。当标准不再是悬于庙堂的宏大宣告,而是悄然沉入每一位开发者的日常工作流,成为其思考与创造的延伸——这或许,就是属于 Anthropic 的,那个定义未来的“iPhone 时刻”。


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:漕河泾小黑屋 黑屋Ω号 黑屋Ω号《2025年终复盘:Anthropic 如何定义 Agent 开发的 iPhone 时刻》

评论:0   参与:  0