关于AI“智能体”定义的若干问题

admin 2026-05-18 05:12:32 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 该文档系统分析了AI智能体的定义共识与分歧,指出自主性、多步骤行动和目标导向是核心要素,同时探讨了LLM必要性、记忆能力、多智能体协作等关键技术争议,并强调政策法律与技术定义的相互作用仍处于早期阶段,建议避免过早进行法律化界定。 综合评分: 70 文章分类: 技术标准,政策法规,AI安全,安全建设,其他


cover_image

关于AI“智能体”定义的若干问题

原创

原浩 原浩

苏州信息安全法学所

2026年5月16日 22:20 江苏

在小说阅读器读本章

去阅读

前  言

从当前政策制定和法律监管者、智库和行业分析机构、国际标准组织和开源社区、AI相关企业对Agentic AI、AI Agents的定义看,基本上完成了五花八门的随意性和零散化描述到“行为体”“智能体”严肃讨论的过渡(但又与另一个相关概念“具身智能”不同,本文暂不涉及);为讨论方便,假定这些英文都对应于《智能体规范应用与创新发展实施意见》所称的“智能体”。尽管方法各异、各有侧重,但仍可提炼一些基本共识,这些共识构成了所有定义都兼容的基本要素。

01

自主性——

智能体能够在无需人类干预的情况下运行。尽管各个定义对自主性的界定承认从半自主到完全自主的差异,并对是否干预附加了“必要时”“持续性”等限定条件,但基本上都将其列为关键维度并作出回应。这里的人类干预和自主程度形成一种此消彼长的关系。

02

步骤或行动——

主要定义都不同程度体现了“感知、规划、推理、行动”等多步骤或递进执行过程。无论其感知的来源是基于人工、模型还是指示(或多者结合的输入),都不再局限于结果本身的输出,而开始注重输出的影响——输出不仅是目标,也成为实现目标的手段。

03

目标导向——

智能体的行为是为了实现特定目标,这一表述为大多数定义所载明。当然这一目标可以是输出本身,也可以是更完整的生成或执行。但无论如何所有定义都在意图“多走一步”,并强调目标实现中与环境的交互和影响——智能体“行为”能够影响其所在的物理或虚拟环境,并在一定程度上接受环境对自身的反馈(适应性)。

在区分模型和智能体,并努力趋近和促成上述这些基础共识的同时,本文认为仍有大量的基础概念或关系需要梳理,这不仅是比较法研究所要求的对不同组织所进行定义观察的自然呈现,也必然在未来一定程度上影响智能体的发展进路和法律规制。

一、是否需要LLM才能称为AI智能体

政策制定和法律监管者和国际标准组织的定义持宽泛态度,不限定底层技术(可以是规则系统、经典RL或当前LLM、ML等模型),而开源社区和AI企业的部分定义倾向于围绕LLM展开,将LLM作为训练、处理和推理“引擎”和智能体核心特征之一。这一差异显然与其定位密切相关。

本文认为,对智能体所依赖的底层技术应保持包容,既可以有基于规则的简单智能体,也有基于各类学习模型的复杂智能体。尽管之前LLM暂时领先,但其他各种模型、方式亦在追赶,相互借鉴且并不相互排斥——“谁负谁胜出天知晓”。

二、记忆是否属于智能体的必备能力

一些定义,包括中国网信办的界定明确将记忆能力(或持续存在的内部状态)写入定义,但大部分组织的智能体定义并未直接明确,AI企业的定义中则普遍未将记忆列为必要条件。

本文认为,记忆能力尽管非常重要(不管是临时存储还是长期存储,这从当前存储市场的热度也能间接佐证),且在几乎所有已知的智能体中都有不同程度的以“要素”或“组件”级别和形式的体现,但整体上看,记忆更多是智能体的增强功能而非识别特征——这可简单类比为“肌肉记忆”,其记忆能力并非来源或存储于自身,而依赖于神经系统——对应在智能体语境中的模型能力。

在对记忆的进一步细分讨论和理解上,离线状态的智能体可能将不依赖在线记忆,而在线、交互、自适应或多智能体则更可能需要记忆能力。

三、多智能体(multiagent)协作是核心特性还是扩展功能

上一问题自然引出这一问题。大多数定义来源将单智能体作为默认假设,多智能体在两个层面表达:一是所谓的子智能体(subagents),但由于子智能体在步骤完成或任务实现后会以会话注销等方式关闭、删除,因此一般理解其不具备“独立”的智能体资格;而在定义中引入多智能体的组织中,多智能体应视为一种高级的架构模式,而非定义的必要部分。但无论如何,从Agent(代表行动)的语义本意出发,可能天然的隐含着多实体交互。

这一分歧实际上映射出长久以来AI“终极”实现形式的底层逻辑差异,一种是类似“天网”或“蜂群”的集中式AI,一种则是更扁平化和分布式的AI。

四、工具调用是核心机制还是增强选项

偏向实务的组织,如NIST和开源社区的定义中,工具调用几乎处于核心地位和关键机制。而在注重政策制定和法律监管的场景下,工具调用更多的使用“行动”进行模糊和替代。这种差异反映了实践导向与概念抽象之间的冲突。

本文认为,无论是外部既有工具(浏览器、代码或API),还是基于推理、反馈形成的自定义工具(skills),都是智能体有别于模型本身的典型特征,工具调用意味着智能体作为(非封闭)“系统”的内外部信息交互和控制,并有助于降低对AI透明度的治理焦虑。甚至在更广义上,人类的介入也是工具的一种形式化体现。

五、政策法律治理和技术定义之间存在何种作用

严格来讲,这一问题的结论来源于不同定义之间的比较观察。显然,欧盟人工智能法和OECD的定义影响了NIST的定义和演进方向,而开源社区、AI相关企业也在以持续商业实践、政企互动等寻求对政策法律的影响。

本文认为,从行业、产业出发的这种影响不仅体现为迎合监管需求的自主性分级、安全机制原生等治理上,也通过智能体的不断构造、复杂化发展等方式直接作用于政策制定和法律监管视域。这种相互作用仍处于非常早期的阶段,并不应过早的对智能体进行法律化的概念界定。

结 语

对不同组织的定义比较、共识提炼和分歧分析基础上,可以再做简要总结。

一是不同定义都回避了“何为智能”,自主、目标规划和行为、“使用工具”是否体现了某种智能,没有一个组织敢于直面和陈述,但都隐含了发现对“推理”和“行为”蕴含智能的渴望;

二是智能体的形态和生态仍远未充分展开,随着智能体从单一化到系统性的演化和行业渗透,监管关注和安全治理维度的加入,智能体定义势必会有一个持续、激烈的塑造过程。这使得对定义的技术标准化表达,和向法律定义与属性的抽象转化成为可预见的新问题。

转载交流

 欢迎联系

 谢老师:13771998064(同微信)

扫码关注


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:苏州信息安全法学所 原浩 原浩《关于AI“智能体”定义的若干问题》

评论:0   参与:  0