2025-12-23 16:02:26 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： Checkmarx披露AIAgent人机交互机制存在LITL漏洞，攻击者利用提示词伪造审批对话框内容或隐藏恶意指令，诱导用户批准高危操作。这导致安全防线沦为攻击面，引发代码执行风险。建议开发者视HITL为不可信，限制渲染格式并验证一致性，用户需警惕富UI环境下的欺骗。 综合评分： 88 文章分类： AI安全,漏洞分析,安全意识

cover_image

人机交互防线失守：新型攻击将AI安全机制转化为漏洞利用载体

船山信安

2025年12月22日 17:00 湖南

Checkmarx最新研究表明，AI Agent所依赖的人机交互（HITL）安全机制可能被攻破，攻击者能够将其武器化来运行恶意代码。HITL对话框作为最后一道安全防线（即”最终确认”环节），通常会在执行敏感操作（如运行代码、修改文件或访问系统资源）前触发。

“谎言循环”攻击伪造审批对话框

研究人员将这种技术命名为”谎言循环”（Lies-in-the-Loop，LITL），攻击者通过特殊构造的AI提示词嵌入恶意指令，从而误导用户审批对话框的内容。研究结果表明，单纯依靠人工审核环节已无法有效防范提示词层面的滥用。当用户无法确信审批内容的真实性时，HITL机制就从安全护栏变成了攻击面。

“LITL攻击利用了用户对审批对话框的信任，”Checkmarx团队在博客中指出，”通过操控对话框显示内容，攻击者将安全机制转化为武器——只要提示看起来安全，用户就会不加质疑地批准。”

对话框伪造技术将监管转化为攻击手段

该漏洞源于AI系统向用户呈现确认对话框的方式。HITL工作流通常会概括AI Agent要执行的操作，期望人工审核者能在点击批准前发现异常。Checkmarx证实，攻击者可通过以下方式操控对话框：

用无害文本填充有效载荷，将危险指令挤出可视区域
精心设计提示词，使AI生成与实际执行内容不符的误导性摘要
在终端类界面中，利用长文本或格式化输出掩盖恶意内容

由于许多AI Agent拥有高权限，一次被误导的批准就可能直接导致代码执行、操作系统命令运行、文件系统访问或后续入侵。研究人员还发现，攻击者能滥用Markdown渲染和布局行为，在视觉上分离无害文本与隐藏命令，或操纵摘要内容使其看起来没有恶意。

“理论上攻击者可突破HITL对话框的Markdown语法限制，向用户呈现伪造界面，这将催生更复杂且难以检测的LITL攻击，”研究团队补充道。

针对开发者和用户的防御建议

Checkmarx向AI Agent开发者提出以下防护措施：

将HITL对话框视为潜在可操纵对象而非可信组件
限制对话框渲染方式
减少复杂UI格式的使用
明确区分用户可见摘要与实际执行操作
验证已批准操作是否与用户确认时所见内容一致

对于终端用户，研究人员指出，在VS Code等富UI环境中运行的Agent比纯文本终端更易识别欺骗行为。Checkmarx已向Anthropic和微软披露该问题，两家公司虽确认报告但未将其归类为安全漏洞。

来源：https://www.freebuf.com/ 感谢【tttffff】

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：船山信安《人机交互防线失守：新型攻击将AI安全机制转化为漏洞利用载体》