中国科学院智能信息处理重点实验室关于文生图扩散模型后门检测的工作被T-PAMI接收

admin 2026-01-26 02:21:34 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 中科院关于文生图扩散模型后门检测工作被T-PAMI接收。该研究提出动态注意力分析DAA,利用模型动态特征检测后门。通过分析跨注意力图演化,提出DAA-I和DAA-S两种方法。实验表明该方法在六种攻击场景下显著优于现有技术,平均F1值达79.27%。 综合评分: 80 文章分类: AI安全,漏洞分析,解决方案


cover_image

中国科学院智能信息处理重点实验室关于文生图扩散模型后门检测的工作被T-PAMI接收

信息网络安全杂志

2026年1月24日 17:02 上海

近日,中国科学院智能信息处理重点实验室关于文生图扩散模型后门检测的工作“Dynamic Attention Analysis for BackdoorDetection in Text-to-Image Diffusion Models”(作者:王中琦,张杰,山世光,陈熙霖)被T-PAMI接收。T-PAMI全称为IEEE Transactions on Pattern Analysis and Machine Intelligence, 是模式识别、计算机视觉及机器学习领域的主流国际期刊, 2025年公布的影响因子为18.6。

最近的研究表明,文生图扩散模型易受到后门攻击,攻击者可以植入隐蔽的文本触发器来操控模型输出。以往的后门检测方法主要侧重于利用后门样本的静态特征,然而扩散模型启发于动力学模型,其动态性是其内在的关键属性。为此,本研究引入了一种全新的后门检测视角,称为动态注意力分析(Dynamic Attention Analysis, DAA,并表明这种动态特征能更好的作为后门样本的指示特征。具体的,通过观察跨注意力图的动态演化过程,我们发现后门样本在 token(即句子结束符)展现出与良性样本显著不同的特征演化模式。为了量化这些动态异常,我们首先提出了DAA-I方法,该方法将各 token 的注意力图视为空间上独立的,并使用Frobenius范数衡量其动态特征。进一步,为了更好地捕捉注意力图之间的交互关系并优化提取的特征,我们提出了一种基于动力学系统(Dynamical System)的检测方法,称为DAA-S。该模型通过图结构的状态方程来刻画注意力图之间的空间相关性。我们从理论上证明了该模型的全局渐近稳定性,确保了特征建模的鲁棒性。在六种具有代表性的后门攻击场景中实验证明,我们的方法在检测性能上显著优于现有方法,平均F1值达到 79.27%,AUC达到86.27%。

来源:中国科学院智能信息处理重点实验室

信息网络安全

《信息网络安全》创刊于2001年,是由公安部主管,公安部第三研究所、中国计算机学会主办,面向国内外公开发行的国内首批信息安全类期刊之一,于2015年成为中国科技核心期刊,2017年成为中国科学引文数据库来源期刊,2018年成为中文核心期刊,2022年入选CCF计算领域高质量科技期刊分级目录。

中文核心期刊

中国科技核心期刊

中国科学引文数据库来源期刊

CCF计算领域高质量科技期刊

我们在不断努力和完善中,期待您的关注和支持!


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:信息网络安全杂志 《中国科学院智能信息处理重点实验室关于文生图扩散模型后门检测的工作被T-PAMI接收》

评论:0   参与:  0