人机交互防线失守:新型攻击将AI安全机制转化为漏洞利用载体

admin 2025-12-23 16:02:26 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: Checkmarx披露AIAgent人机交互机制存在LITL漏洞,攻击者利用提示词伪造审批对话框内容或隐藏恶意指令,诱导用户批准高危操作。这导致安全防线沦为攻击面,引发代码执行风险。建议开发者视HITL为不可信,限制渲染格式并验证一致性,用户需警惕富UI环境下的欺骗。 综合评分: 88 文章分类: AI安全,漏洞分析,安全意识


cover_image

人机交互防线失守:新型攻击将AI安全机制转化为漏洞利用载体

船山信安

2025年12月22日 17:00 湖南

Checkmarx最新研究表明,AI Agent所依赖的人机交互(HITL)安全机制可能被攻破,攻击者能够将其武器化来运行恶意代码。HITL对话框作为最后一道安全防线(即”最终确认”环节),通常会在执行敏感操作(如运行代码、修改文件或访问系统资源)前触发。

“谎言循环”攻击伪造审批对话框

研究人员将这种技术命名为”谎言循环”(Lies-in-the-Loop,LITL),攻击者通过特殊构造的AI提示词嵌入恶意指令,从而误导用户审批对话框的内容。研究结果表明,单纯依靠人工审核环节已无法有效防范提示词层面的滥用。当用户无法确信审批内容的真实性时,HITL机制就从安全护栏变成了攻击面。

“LITL攻击利用了用户对审批对话框的信任,”Checkmarx团队在博客中指出,”通过操控对话框显示内容,攻击者将安全机制转化为武器——只要提示看起来安全,用户就会不加质疑地批准。”

对话框伪造技术将监管转化为攻击手段

该漏洞源于AI系统向用户呈现确认对话框的方式。HITL工作流通常会概括AI Agent要执行的操作,期望人工审核者能在点击批准前发现异常。Checkmarx证实,攻击者可通过以下方式操控对话框:

  • 用无害文本填充有效载荷,将危险指令挤出可视区域
  • 精心设计提示词,使AI生成与实际执行内容不符的误导性摘要
  • 在终端类界面中,利用长文本或格式化输出掩盖恶意内容

由于许多AI Agent拥有高权限,一次被误导的批准就可能直接导致代码执行、操作系统命令运行、文件系统访问或后续入侵。研究人员还发现,攻击者能滥用Markdown渲染和布局行为,在视觉上分离无害文本与隐藏命令,或操纵摘要内容使其看起来没有恶意。

“理论上攻击者可突破HITL对话框的Markdown语法限制,向用户呈现伪造界面,这将催生更复杂且难以检测的LITL攻击,”研究团队补充道。

针对开发者和用户的防御建议

Checkmarx向AI Agent开发者提出以下防护措施:

  • 将HITL对话框视为潜在可操纵对象而非可信组件
  • 限制对话框渲染方式
  • 减少复杂UI格式的使用
  • 明确区分用户可见摘要与实际执行操作
  • 验证已批准操作是否与用户确认时所见内容一致

对于终端用户,研究人员指出,在VS Code等富UI环境中运行的Agent比纯文本终端更易识别欺骗行为。Checkmarx已向Anthropic和微软披露该问题,两家公司虽确认报告但未将其归类为安全漏洞。

来源:https://www.freebuf.com/ 感谢【tttffff】


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:船山信安 《人机交互防线失守:新型攻击将AI安全机制转化为漏洞利用载体》

评论:0   参与:  3