2026-04-04 05:20:48 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文提出DGP框架，通过解耦图提示学习提升图分布外检测性能。该方法冻结预训练GNN编码器，分别学习类别相关和类别无关的提示图来建模细粒度ID模式。实验表明DGP在10个数据集上平均AUC提升3.63%，训练效率提升31-64倍，为图OOD检测提供了有效的预训练+提示学习范式。 综合评分： 85 文章分类： 漏洞分析,AI安全,解决方案,安全工具,技术标准

cover_image

TKDE 2026｜DGP：面向图分布外检测的解耦图提示学习

原创

郝宇郝宇

北邮 GAMMA Lab

2026年4月3日 13:41 北京

一、简介

当测试图数据与训练图数据不再来自同一分布时，图神经网络（GNNs）往往会面临显著的可靠性风险。在真实应用中，模型可能会对分布外（Out-of-Distribution, OOD）样本给出高置信度但错误的预测，因此，如何及时识别这些异常输入，成为保障图学习系统安全性与鲁棒性的关键问题。近年来，图分布外检测（Graph OOD Detection）逐渐成为图学习领域的重要研究方向。

现有图 OOD 检测方法通常通过端到端训练 GNN，从多个粒度或多个视角建模 In-Distribution（ID）图的特征模式。然而，由于训练阶段无法接触 OOD 数据，模型缺少直接的监督信号，导致端到端训练得到的编码器未必能够充分学习到真正有利于 OOD 检测的表示。另一方面，预训练图神经网络已经展现出较强的泛化表示能力，因此，一个自然的问题是：能否在不重新训练整个编码器的前提下，利用预训练模型完成更强的图 OOD 检测？

针对这一问题，这篇论文提出了 Disentangled Graph Prompting（DGP）。该方法结合 Pre-Training + Prompting 范式，在冻结预训练 GNN 编码器参数的前提下，通过学习图提示（Graph Prompts）来激活模型的 OOD 检测能力。更进一步，DGP 将 ID 图中的关键信息划分为 类别相关（Class-Specific） 和 类别无关（Class-Agnostic） 两类细粒度模式，并通过两个独立提示生成器分别建模，从而更有效地区分 ID 与 OOD 图。

论文标题：Disentangled Graph Prompting for Out-Of-Distribution Detection
作者：杨成，郝宇，张琦，石川
论文链接：https://arxiv.org/abs/2603.29644
代码链接：https://github.com/BUPT-GAMMA/DGP

二、核心方法：DGP框架

DGP（Disentangled Graph Prompting）面向图分布外检测任务，在 预训练 + 提示学习 的范式下对图编码器进行适配。该方法冻结预训练 GNN 编码器，通过学习两种不同视角的 Prompt Graph，对 ID 图中的细粒度模式进行建模，并将其用于最终的 OOD 检测。

2.1 方法概述

DGP 旨在同时建模两类互补的 ID 模式：一类是 类别相关模式，用于捕获有助于区分不同 ID 类别的判别性结构；另一类是 类别无关模式，用于刻画不同 ID 图样本之间共享的共性结构。为此，DGP 设计了两个独立的 Prompt Generator，对输入图进行不同方式的边权重调整，分别生成 Class-Specific Prompt Graph 和 Class-Agnostic Prompt Graph。

图2：DGP整体架构

整体流程如下：

对于输入图，两个 Prompt Graph 首先由对应的生成器构造出来，再被送入冻结的预训练 GNN 编码器得到图表示；
训练阶段通过类别相关损失与类别无关损失约束两个分支，并结合距离正则项避免 Prompt Graph 退化为平庸解；
测试阶段则基于两种 Prompt Graph 的表示计算 Mahalanobis Distance，并加权求和得到最终 OOD 分数：

其中，与分别表示类别相关与类别无关的 Prompt Generator，表示冻结的预训练 GNN 编码器，为基于 Mahalanobis Distance 的打分函数，为平衡两个分支贡献的超参数。该框架在保留预训练编码器表示能力的同时，通过细粒度提示学习增强了图 OOD 检测效果。

2.2 Prompt Graph Generator

DGP 通过修改输入图的拓扑结构来实现提示学习。具体来说，模型并不新增边，而是仅对原图中已有边的权重进行调整，从而构造出对应的 Prompt Graph。为了评估边的重要性，DGP 先利用预训练 GNN 提取节点表示，再将一条边两端节点的表示拼接后送入多层感知机（MLP），输出该边在 Prompt Graph 中的权重。

对于图中连接节点和的边，其可学习权重形式为：

其中，与表示由预训练 GNN 提取得到的节点表示，为 MLP 的参数。通过这种方式，DGP 根据节点的高层语义信息而非原始属性，来判断一条边在 OOD 检测中是否重要。

2.2.1 Class-Specific Prompt Graph

对于类别相关视角，DGP 使用一组独立参数的 MLP，根据原图中边两端节点的表示生成 Class-Specific Prompt Graph：。该提示图用于强调与类别判别相关的关键子结构，使后续编码得到的图表示更具判别性。

2.2.2 Class-Agnostic Prompt Graph

对于类别无关视角，DGP 使用另一组独立参数的 MLP，生成 Class-Agnostic Prompt Graph：。这一分支强调不同 ID 类别之间共享的公共结构信息，用于建模更稳定的 ID 共性模式。由于两个分支参数独立，它们能够从不同角度对原始图进行重加权，从而为后续的解耦训练提供基础。

2.3 促进解耦建模

在图 OOD 检测中，训练阶段无法获得 OOD 数据，因此不能直接围绕测试时的检测目标进行监督。DGP 通过利用 ID 图的标签信息，对两个 Prompt Generator 施加不同方向的约束，使它们分别学习类别相关模式与类别无关模式。整个解耦建模部分由 类别相关损失、类别无关损失 和 距离正则项 三部分组成。

2.3.1 类别相关损失

在类别相关分支中，Prompt Graph 经过冻结的 GNN 编码器与预测器后，得到类别分布：

其中，为预训练 GNN 编码器参数，为预测器参数。随后，模型通过真实标签对预测分布进行监督，其损失函数为：

这一损失促使类别相关 Prompt Graph 更关注能够支持类别判别的关键结构，从而学习到更强的判别性 ID 模式。

2.3.2 类别无关损失

在类别无关分支中，Prompt Graph 同样经过编码器和预测器得到类别分布：

但与类别相关分支不同，这里并不让预测结果对齐到真实标签，而是让其接近均匀分布：

这一约束使模型弱化具体类别信息，转而挖掘在所有 ID 类别中普遍存在的公共结构，从而学习类别无关模式。

2.3.3 解耦损失

为了联合利用上述两类模式，DGP 将两部分损失加权求和，得到整体的解耦损失：

其中，为平衡两个分支的重要性系数。该损失推动模型从类别相关与类别无关两个互补视角共同学习 ID 模式。

2.3.4 距离正则项

如果仅优化解耦损失，Prompt Generator 可能会出现 Trivial Solution，例如为所有边分配较大权重，使提示图与原图过于相似，无法突出真正关键的结构。为避免这一问题，DGP 引入了 Distance Loss，推动 Prompt Graph 的表示与原图表示保持适度差异。对应的两个距离项分别为：

最终的距离正则项写为：

其中，与为两个超参数。该项能够抑制平庸解，使 Prompt Generator 更倾向于保留与 OOD 检测最相关、最具代表性的边。

2.3.5 训练与测试策略

DGP 采用交替优化的训练方式。首先，更新两个 Prompt Generator 和预测器，使其最小化解耦损失；然后固定预测器，仅更新两个 Prompt Generator，使其最小化距离正则项。通过这种迭代训练，两个分支能够逐步学习到互补且稳定的 ID 模式。测试阶段去掉预测器，仅保留两个 Prompt Generator 与冻结的 GNN 编码器，根据两个 Prompt Graph 的 Mahalanobis Distance 分数进行 OOD 判断。

三、实验结果与分析

3.1 实验设置

论文在 10 组 ID/OOD 数据集 上评估 DGP，覆盖分子图、社交网络图和生物信息图等多个领域。实验结果表明，DGP 在整体性能上显著优于现有方法。

在模型配置上，DGP 选择两种自监督图预训练方法 GCL 和 SimGRACE 来初始化图编码器，并统一采用 3-layer GIN 作为 Backbone。为了保证比较公平，论文还纳入了四类基线方法：非图 OOD 方法、预训练/微调图模型、图异常检测方法，以及图 OOD 检测方法。

3.2 主实验结果

表2: OOD检测结果

实验结果如上图所示，具体来看：

非图 OOD 方法直接迁移到图场景时表现很差，平均 AUC 仅为 48.95%，说明图 OOD 检测不能简单套用视觉或通用表征学习中的 OOD 技术，而必须显式考虑图结构信息与关系依赖。
相比 Fine-Tuned GNN，DGP 的平均 AUC 相对提升 13.65%；
相比最优 SOTA 基线，DGP 平均仍取得 3.63% 的相对 AUC 提升；
在 10 个数据集中的 8 个上，DGP 取得了最佳结果。

这说明 DGP 所提出的“细粒度模式解耦 + Prompt 学习”设计，不只是理论上合理，也在实际性能上取得了稳定收益。

3.3 可视化

图3：决策分数分布图

为了更直观地说明 DGP 为什么有效，论文进一步可视化比较了预训练 GNN 与 DGP 在 10 组数据集上的 ID/OOD 决策分数分布（图中为其中2组）。每个子图中左图表示直接使用预训练编码器时的分布，右图表示经过 DGP 提示学习后的分布。

结果显示，相比直接使用预训练 GNN，DGP 明显减小了 ID/OOD 分布之间的重叠区域。平均 overlap 从 0.69 降到 0.44，相对下降 35.94%。这说明 DGP 学到的 Prompt Graph 能够有效放大 ID 图与 OOD 图之间的差异，使 OOD 样本在表示空间中更加分散、更加容易被检测出来。

3.4 消融实验与预训练初始化分析

图4：消融实验

论文在图4中给出了两组关键分析结果。图4(a) 展示了不同消融版本的 AUC 对比，图4(b) 则比较了不同 GNN 编码器初始化方式对最终性能的影响。

在消融实验中，论文构造了三个变体：

V0：去掉类别无关分支，仅保留类别相关分支；
V1：去掉类别相关分支，仅保留类别无关分支；
V2：去掉 distance loss，仅保留 disentangle loss。

结果表明，完整的 DGP 始终优于所有消融版本。这说明两个分支并不是功能重复，而是提供了互补的信息来源：类别相关分支更关注判别性结构，类别无关分支更强调共享共性，而 Distance Loss 则在避免 Trivial Solution 方面发挥了关键作用。

在初始化分析中，论文比较了 GCL 预训练、SimGRACE 预训练 和 随机初始化 三种策略。结果表明，随机初始化的性能明显更差。以几个代表性数据集为例，随机初始化相比 GCL 和 SimGRACE 平均分别低 11.12% 和 9.88% 的 AUC。这说明 DGP 的性能提升并不只是来自 Prompt 结构本身，更重要的是 预训练表示能力与提示学习机制的协同作用。

3.5 超参数与模型结构分析

图5：超参数实验

论文还在图5中分析了多个关键超参数对性能的影响，包括 Disentangle Loss 中的权重参数、Distance Loss 中的权重参数，以及 Prompt Graph Generator 中 MLP 的层数。整体来看，DGP 在较宽的参数范围内都保持了较稳定的性能，说明该方法具有较好的鲁棒性。此外，实验发现 2-layer MLP 在表达能力与泛化能力之间取得了较好的平衡，因此被采用为默认配置。

3.6 效率分析

图6：运行时间对比

除了检测性能，论文还在图6中比较了 DGP 与多个代表性 SOTA 方法的训练时间。结果显示，DGP 在保证更优 AUC 的同时，训练效率也明显更高。

具体来看，在 BZR-COX2 上，DGP-GCL 将训练时间从 SEGO 的 353.35s 和 GOOD-D 的 277.23s 降至 7.48s；在 PTC_MR-MUTAG 上，相比 SEGO 实现了 31× 以上加速；在 IMDB-M-IMDB-B 上，相比 HGOE 实现了 64× 的训练时间缩减。整体来看，DGP 通过复用预训练 GNN 编码器、避免重复的端到端训练，在保证性能的同时显著降低了训练成本。

四、总结

本文针对图分布外检测这一重要问题，提出了一种结合 预训练图编码器 与 图提示学习 的新框架 DGP。与传统端到端图 OOD 方法不同，DGP 冻结预训练 GNN，仅通过两个独立的提示生成器从 class-specific 与 class-agnostic 两个视角挖掘细粒度 ID 模式，从而提升 OOD 检测能力。

实验结果表明，DGP 不仅在性能上显著优于现有方法，而且在训练效率和解释性上也表现突出。整体来看，这项工作证明了：在图学习任务中，Prompting 不仅可以作为一种轻量替代微调的工程方案，也可以成为一种具有明确建模意义的研究范式。

本期责任编辑：杨成

本期编辑：赵明宇

北邮 GAMMA Lab 公众号

主编：石川

责任编辑：杨成

编辑：赵明宇

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：北邮 GAMMA Lab 郝宇郝宇《TKDE 2026｜DGP：面向图分布外检测的解耦图提示学习》