一图看懂|从说错话到做错事,Skill成智能体风险新入口

admin 2026-05-24 05:34:25 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 360AI安全研究院报告指出智能体时代安全风险从模型‘说错话’转向具备执行权后的‘做错事’,Skill成为风险新入口。核心风险是‘合法动作的非法后果’,即智能体在权限内执行错误动作导致数据泄露、越权操作等真实危害,企业需重建安全边界应对。 综合评分: 85 文章分类: AI安全,智能体安全,解决方案,威胁情报,安全运营


cover_image

一图看懂|从说错话到做错事,Skill成智能体风险新入口

360数字安全

2026年5月22日 18:48 北京

在小说阅读器读本章

去阅读

以下文章来源于360人工智能安全研究院 ,作者全小安

360人工智能安全研究院 .

守望安全,成就未来

大模型时代,AI安全问题主要是“说错话”:幻觉、越狱、违规输出、敏感信息泄露。

但智能体时代,真正的变化是:AI开始拥有“执行权”。

当智能体开始调用工具、访问数据、执行流程,它就不再只是聊天机器人,而是具备执行能力的主体。一旦被诱导、污染或误判,风险就可能从错误回答,变成真实的数据泄露、越权操作、流程误执行甚至业务中断。近期受到关注的龙虾(OpenClaw),正是智能体生态快速发展的典型代表;而作为智能体能力扩展核心载体的 Skill,也让安全风险从模型本身延伸到工具调用、权限边界和运行治理。

360 AI安全研究院发布《AI安全系列报告:智能体安全新范式——当AI有了手和脚,企业安全边界必须重建》。报告提出,智能体安全的核心,不只是防止AI被攻击,更要防止AI在合法权限内执行错误动作。我们将这一风险定义为“合法动作的非法后果”。

我们将本期报告的核心观点整理成一张长图,帮助大家快速理解智能体安全的新变化、新风险与应对路径。

完整报告请点击文末“阅读原文”下载查看。


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:360数字安全 《一图看懂|从说错话到做错事,Skill成智能体风险新入口》

评论:0   参与:  0