TKDE2026|DGP:面向图分布外检测的解耦图提示学习

admin 2026-04-04 05:20:48 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本文提出DGP框架,通过解耦图提示学习提升图分布外检测性能。该方法冻结预训练GNN编码器,分别学习类别相关和类别无关的提示图来建模细粒度ID模式。实验表明DGP在10个数据集上平均AUC提升3.63%,训练效率提升31-64倍,为图OOD检测提供了有效的预训练+提示学习范式。 综合评分: 85 文章分类: 漏洞分析,AI安全,解决方案,安全工具,技术标准


cover_image

TKDE 2026|DGP:面向图分布外检测的解耦图提示学习

原创

郝宇 郝宇

北邮 GAMMA Lab

2026年4月3日 13:41 北京

一、简介

当测试图数据与训练图数据不再来自同一分布时,图神经网络(GNNs)往往会面临显著的可靠性风险。在真实应用中,模型可能会对分布外(Out-of-Distribution, OOD)样本给出高置信度但错误的预测,因此,如何及时识别这些异常输入,成为保障图学习系统安全性与鲁棒性的关键问题。近年来,图分布外检测(Graph OOD Detection)逐渐成为图学习领域的重要研究方向。

现有图 OOD 检测方法通常通过端到端训练 GNN,从多个粒度或多个视角建模 In-Distribution(ID)图的特征模式。然而,由于训练阶段无法接触 OOD 数据,模型缺少直接的监督信号,导致端到端训练得到的编码器未必能够充分学习到真正有利于 OOD 检测的表示。另一方面,预训练图神经网络已经展现出较强的泛化表示能力,因此,一个自然的问题是:能否在不重新训练整个编码器的前提下,利用预训练模型完成更强的图 OOD 检测?

针对这一问题,这篇论文提出了 Disentangled Graph Prompting(DGP)。该方法结合 Pre-Training + Prompting 范式,在冻结预训练 GNN 编码器参数的前提下,通过学习图提示(Graph Prompts)来激活模型的 OOD 检测能力。更进一步,DGP 将 ID 图中的关键信息划分为 类别相关(Class-Specific) 和 类别无关(Class-Agnostic) 两类细粒度模式,并通过两个独立提示生成器分别建模,从而更有效地区分 ID 与 OOD 图。

  • 论文标题:Disentangled Graph Prompting for Out-Of-Distribution Detection
  • 作者:杨成,郝宇,张琦,石川
  • 论文链接:https://arxiv.org/abs/2603.29644
  • 代码链接:https://github.com/BUPT-GAMMA/DGP

二、核心方法:DGP框架

DGP(Disentangled Graph Prompting)面向图分布外检测任务,在 预训练 + 提示学习 的范式下对图编码器进行适配。该方法冻结预训练 GNN 编码器,通过学习两种不同视角的 Prompt Graph,对 ID 图中的细粒度模式进行建模,并将其用于最终的 OOD 检测。

2.1 方法概述

DGP 旨在同时建模两类互补的 ID 模式:一类是 类别相关模式,用于捕获有助于区分不同 ID 类别的判别性结构;另一类是 类别无关模式,用于刻画不同 ID 图样本之间共享的共性结构。为此,DGP 设计了两个独立的 Prompt Generator,对输入图进行不同方式的边权重调整,分别生成 Class-Specific Prompt Graph 和 Class-Agnostic Prompt Graph。

图2:DGP整体架构

整体流程如下:

  1. 对于输入图 ,两个 Prompt Graph 首先由对应的生成器构造出来,再被送入冻结的预训练 GNN 编码器得到图表示;
  2. 训练阶段通过类别相关损失与类别无关损失约束两个分支,并结合距离正则项避免 Prompt Graph 退化为平庸解;
  3. 测试阶段则基于两种 Prompt Graph 的表示计算 Mahalanobis Distance,并加权求和得到最终 OOD 分数:

其中, 与  分别表示类别相关与类别无关的 Prompt Generator, 表示冻结的预训练 GNN 编码器, 为基于 Mahalanobis Distance 的打分函数, 为平衡两个分支贡献的超参数。该框架在保留预训练编码器表示能力的同时,通过细粒度提示学习增强了图 OOD 检测效果。

2.2 Prompt Graph Generator

DGP 通过修改输入图的拓扑结构来实现提示学习。具体来说,模型并不新增边,而是仅对原图中已有边的权重进行调整,从而构造出对应的 Prompt Graph。为了评估边的重要性,DGP 先利用预训练 GNN 提取节点表示,再将一条边两端节点的表示拼接后送入多层感知机(MLP),输出该边在 Prompt Graph 中的权重。

对于图  中连接节点  和  的边,其可学习权重形式为:

其中, 与  表示由预训练 GNN 提取得到的节点表示, 为 MLP 的参数。通过这种方式,DGP 根据节点的高层语义信息而非原始属性,来判断一条边在 OOD 检测中是否重要。

2.2.1 Class-Specific Prompt Graph

对于类别相关视角,DGP 使用一组独立参数  的 MLP,根据原图中边两端节点的表示生成 Class-Specific Prompt Graph:。该提示图用于强调与类别判别相关的关键子结构,使后续编码得到的图表示更具判别性。

2.2.2 Class-Agnostic Prompt Graph

对于类别无关视角,DGP 使用另一组独立参数  的 MLP,生成 Class-Agnostic Prompt Graph:。这一分支强调不同 ID 类别之间共享的公共结构信息,用于建模更稳定的 ID 共性模式。由于两个分支参数独立,它们能够从不同角度对原始图进行重加权,从而为后续的解耦训练提供基础。

2.3 促进解耦建模

在图 OOD 检测中,训练阶段无法获得 OOD 数据,因此不能直接围绕测试时的检测目标进行监督。DGP 通过利用 ID 图的标签信息,对两个 Prompt Generator 施加不同方向的约束,使它们分别学习类别相关模式与类别无关模式。整个解耦建模部分由 类别相关损失类别无关损失 和 距离正则项 三部分组成。

2.3.1 类别相关损失

在类别相关分支中,Prompt Graph 经过冻结的 GNN 编码器与预测器后,得到类别分布:

其中, 为预训练 GNN 编码器参数, 为预测器参数。随后,模型通过真实标签  对预测分布进行监督,其损失函数为:

这一损失促使类别相关 Prompt Graph 更关注能够支持类别判别的关键结构,从而学习到更强的判别性 ID 模式。

2.3.2 类别无关损失

在类别无关分支中,Prompt Graph 同样经过编码器和预测器得到类别分布:

但与类别相关分支不同,这里并不让预测结果对齐到真实标签,而是让其接近均匀分布 :

这一约束使模型弱化具体类别信息,转而挖掘在所有 ID 类别中普遍存在的公共结构,从而学习类别无关模式。

2.3.3 解耦损失

为了联合利用上述两类模式,DGP 将两部分损失加权求和,得到整体的解耦损失:

其中, 为平衡两个分支的重要性系数。该损失推动模型从类别相关与类别无关两个互补视角共同学习 ID 模式。

2.3.4 距离正则项

如果仅优化解耦损失,Prompt Generator 可能会出现 Trivial Solution,例如为所有边分配较大权重,使提示图与原图过于相似,无法突出真正关键的结构。为避免这一问题,DGP 引入了 Distance Loss,推动 Prompt Graph 的表示与原图表示保持适度差异。对应的两个距离项分别为:

最终的距离正则项写为:

其中, 与  为两个超参数。该项能够抑制平庸解,使 Prompt Generator 更倾向于保留与 OOD 检测最相关、最具代表性的边。

2.3.5 训练与测试策略

DGP 采用交替优化的训练方式。首先,更新两个 Prompt Generator 和预测器,使其最小化解耦损失 ;然后固定预测器,仅更新两个 Prompt Generator,使其最小化距离正则项 。通过这种迭代训练,两个分支能够逐步学习到互补且稳定的 ID 模式。测试阶段去掉预测器,仅保留两个 Prompt Generator 与冻结的 GNN 编码器,根据两个 Prompt Graph 的 Mahalanobis Distance 分数进行 OOD 判断。

三、实验结果与分析

3.1 实验设置

论文在 10 组 ID/OOD 数据集 上评估 DGP,覆盖分子图、社交网络图和生物信息图等多个领域。实验结果表明,DGP 在整体性能上显著优于现有方法。

在模型配置上,DGP 选择两种自监督图预训练方法 GCL 和 SimGRACE 来初始化图编码器,并统一采用 3-layer GIN 作为 Backbone。为了保证比较公平,论文还纳入了四类基线方法:非图 OOD 方法、预训练/微调图模型、图异常检测方法,以及图 OOD 检测方法。

3.2 主实验结果

表2: OOD检测结果

实验结果如上图所示,具体来看:

  • 非图 OOD 方法直接迁移到图场景时表现很差,平均 AUC 仅为 48.95%,说明图 OOD 检测不能简单套用视觉或通用表征学习中的 OOD 技术,而必须显式考虑图结构信息与关系依赖。
  • 相比 Fine-Tuned GNN,DGP 的平均 AUC 相对提升 13.65%;
  • 相比最优 SOTA 基线,DGP 平均仍取得 3.63% 的相对 AUC 提升;
  • 在 10 个数据集中的 8 个上,DGP 取得了最佳结果。

这说明 DGP 所提出的“细粒度模式解耦 + Prompt 学习”设计,不只是理论上合理,也在实际性能上取得了稳定收益。

3.3 可视化

图3:决策分数分布图

为了更直观地说明 DGP 为什么有效,论文进一步可视化比较了预训练 GNN 与 DGP 在 10 组数据集上的 ID/OOD 决策分数分布(图中为其中2组)。每个子图中左图表示直接使用预训练编码器时的分布,右图表示经过 DGP 提示学习后的分布。

结果显示,相比直接使用预训练 GNN,DGP 明显减小了 ID/OOD 分布之间的重叠区域。平均 overlap 从 0.69 降到 0.44,相对下降 35.94%。这说明 DGP 学到的 Prompt Graph 能够有效放大 ID 图与 OOD 图之间的差异,使 OOD 样本在表示空间中更加分散、更加容易被检测出来。

3.4 消融实验与预训练初始化分析

图4:消融实验

论文在图4中给出了两组关键分析结果。图4(a) 展示了不同消融版本的 AUC 对比,图4(b) 则比较了不同 GNN 编码器初始化方式对最终性能的影响。

在消融实验中,论文构造了三个变体:

  • V0:去掉类别无关分支,仅保留类别相关分支;
  • V1:去掉类别相关分支,仅保留类别无关分支;
  • V2:去掉 distance loss,仅保留 disentangle loss。

结果表明,完整的 DGP 始终优于所有消融版本。这说明两个分支并不是功能重复,而是提供了互补的信息来源:类别相关分支更关注判别性结构,类别无关分支更强调共享共性,而 Distance Loss 则在避免 Trivial Solution 方面发挥了关键作用。

在初始化分析中,论文比较了 GCL 预训练SimGRACE 预训练 和 随机初始化 三种策略。结果表明,随机初始化的性能明显更差。以几个代表性数据集为例,随机初始化相比 GCL 和 SimGRACE 平均分别低 11.12% 和 9.88% 的 AUC。这说明 DGP 的性能提升并不只是来自 Prompt 结构本身,更重要的是 预训练表示能力与提示学习机制的协同作用

3.5 超参数与模型结构分析

图5:超参数实验

论文还在图5中分析了多个关键超参数对性能的影响,包括 Disentangle Loss 中的权重参数、Distance Loss 中的权重参数,以及 Prompt Graph Generator 中 MLP 的层数。整体来看,DGP 在较宽的参数范围内都保持了较稳定的性能,说明该方法具有较好的鲁棒性。此外,实验发现 2-layer MLP 在表达能力与泛化能力之间取得了较好的平衡,因此被采用为默认配置。

3.6 效率分析

图6:运行时间对比

除了检测性能,论文还在图6中比较了 DGP 与多个代表性 SOTA 方法的训练时间。结果显示,DGP 在保证更优 AUC 的同时,训练效率也明显更高。

具体来看,在 BZR-COX2 上,DGP-GCL 将训练时间从 SEGO 的 353.35s 和 GOOD-D 的 277.23s 降至 7.48s;在 PTC_MR-MUTAG 上,相比 SEGO 实现了 31× 以上加速;在 IMDB-M-IMDB-B 上,相比 HGOE 实现了 64× 的训练时间缩减。整体来看,DGP 通过复用预训练 GNN 编码器、避免重复的端到端训练,在保证性能的同时显著降低了训练成本。

四、总结

本文针对图分布外检测这一重要问题,提出了一种结合 预训练图编码器 与 图提示学习 的新框架 DGP。与传统端到端图 OOD 方法不同,DGP 冻结预训练 GNN,仅通过两个独立的提示生成器从 class-specific 与 class-agnostic 两个视角挖掘细粒度 ID 模式,从而提升 OOD 检测能力。

实验结果表明,DGP 不仅在性能上显著优于现有方法,而且在训练效率和解释性上也表现突出。整体来看,这项工作证明了:在图学习任务中,Prompting 不仅可以作为一种轻量替代微调的工程方案,也可以成为一种具有明确建模意义的研究范式。

本期责任编辑:杨成

本期编辑:赵明宇

北邮 GAMMA Lab 公众号

主编:石川

责任编辑:杨成

编辑:赵明宇


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:北邮 GAMMA Lab 郝宇 郝宇《TKDE 2026|DGP:面向图分布外检测的解耦图提示学习》

评论:0   参与:  0