2026-01-17 02:09:08 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 北邮GAMMALAB四篇论文被WWW2026录用，涵盖图分词器RGT实现跨域结构知识迁移、Spattack针对联邦推荐子群投毒攻击、RGLM重构式图指令微调对齐LLM与图数据、FRiskGPT以生成式基础模型统一金融风控任务，实验显示各方案在对应场景显著优于基线并已落地应用。 综合评分： 85 文章分类： AI安全,数据安全,应用安全,安全工具,解决方案

cover_image

快讯｜北邮GAMMA LAB四篇工作被WWW 2026录用

原创

郭枫&赵明宇郭枫&赵明宇

北邮 GAMMA Lab

2026年1月15日 13:42 北京

快讯｜北邮GAMMA LAB四篇工作被WWW 2026录用

WWW 2026

北邮GAMMA LAB实验室四篇工作被WWW 2026录用。

近日，人工智能与万维网交叉领域的顶级会议 The Web Conference 2026（WWW 2026）公布了论文接收结果，今年WWW论文Research Track的录用率为20.1%，Industry Track的录用率为19.4%。GAMMA LAB师生共有4篇论文成功入选。WWW（The Web Conference）是万维网领域历史悠久、学术影响力广泛的顶级国际会议之一，聚焦网络科学、信息检索、数据挖掘、自然语言处理、推荐系统、Web安全与隐私等方向的前沿研究，同时也是中国计算机学会（CCF）推荐的A类国际学术会议。2026年WWW将于4月13日至4月17日在迪拜举办。

录用论文

RGT：Riemannian Graph Tokenizer for Structural Knowledge Transfer RGT: 用于结构知识迁移的黎曼图分词器 Qimin Zhou, Haibo Liu, Yujie Wang, Li Sun and Chuan Shi

Spattack: Subgroup Poisoning Attacks on Federated Recommender Systems Spattack: 面向联邦推荐系统的子群投毒攻击 Bo Yan, Yurong Hao, Dingqi Liu, Huabin Sun, Pengpeng Qiao, Wei Yang Bryan Lim, Yang Cao and Chuan Shi

Toward Graph-Tokenizing Large Language Models with Reconstructive Graph Instruction Tuning 面向图标记化的大语言模型：基于重构图指令微调的方法 Zhongjian Zhang, Xiao Wang, Mengmei Zhang, Jiarui Tan, Chuan Shi

FRiskGPT: A Generative Foundation Model for Financial Risk Detection FRiskGPT: 面向金融风控的生成式基础模型 Zhongjian Zhang, Mengmei Zhang, Dehua Xu, Rongjun Shi, Jianfeng Liu, Fuli Meng, Huajian Xu, Xiao Wang, Ruijia Wang, Junze Chen, Minwei Tang, Chuan Shi

论文详情

RGT：Riemannian Graph Tokenizer for Structural Knowledge Transfer Qimin Zhou, Haibo Liu, Yujie Wang, Li Sun and Chuan Shi

摘要：基础模型处于人工智能的前沿。分词器将原始输入转换为模型能理解的离散表示，对基础模型的成功起着重要作用。与大型语言模型中被深入研究的文本分词器不同，图分词器仍处于早期阶段，面临着处理非欧几里得结构和捕捉结构语义的挑战。如何设计用于结构知识迁移的图分词器？为此，我们提出了一种黎曼图分词器（RGT），建立结构知识与量化表示的联系来支持跨域结构知识转移，该联系由黎曼几何建立。具体来说，我们首先定义几何词汇（树、环和序列），这体现了基本的结构模式，同时反映了图的内在几何特性。其次，我们构造一个黎曼量化器，并提出黎曼直通估计器，将跨域图结构分词为离散的token。为确保不同几何空间的一致性和可迁移性，RGT进一步设计了几何对齐解码器，将不同流形中的token投影到统一的切空间中。我们提供理论分析和几何解释来支持提出方法的有效性。在跨域数据集上的大量实验表明，RGT显著增强了跨域图间的结构知识迁移。

Spattack: Subgroup Poisoning Attacks on Federated Recommender Systems Bo Yan, Yurong Hao, Dingqi Liu, Huabin Sun, Pengpeng Qiao, Wei Yang Bryan Lim, Yang Cao and Chuan Shi

摘要：联邦推荐（FedRec）作为一种在保护用户隐私的同时实现个性化推荐的框架，近年来受到广泛关注。然而，最新研究表明，FedRec 并非完全安全，恶意客户端可通过上传精心构造的梯度实现投毒攻击，从而操纵推荐结果。现有攻击大多面向全体用户展开，容易暴露并增加被检测风险。现实中，攻击者往往更倾向于针对特定用户子群体（例如向老年用户推广保健品），以在保持隐蔽性的同时最大化攻击效果。为填补这一研究空白，我们提出 Spattack，首个面向子群体的联邦推荐投毒攻击方法。Spattack 采用“模拟–推广”范式：首先区分并模拟目标与非目标子群体的用户嵌入，然后选择性地向目标子群体推广特定物品。我们进一步揭示了一个关键的有效性–隐蔽性折中：既要在目标群体中实现强攻击效果，又需尽量减少对非目标群体的影响。为此，Spattack 引入基于对比学习的群体嵌入推远与基于聚类的物品扩充，用于精细化模拟；以及目标–物品嵌入对齐机制，用于强化语义推广。此外，Spattack 还通过自适应权重平衡不同子群体的优化目标。在三个真实数据集上的实验表明，Spattack 即使在恶意用户仅占 0.1% 时，仍能在目标子群体上实现显著攻击效果，同时对非目标用户影响极小，并在主流防御机制下保持较强的稳健性与推荐性能。

Toward Graph-Tokenizing Large Language Models with Reconstructive Graph Instruction Tuning Zhongjian Zhang, Xiao Wang, Mengmei Zhang, Jiarui Tan, Chuan Shi

摘要：大语言模型（LLMs）的显著成功推动了研究者们将其适配为多种图相关任务的通用预测器，最终目标是构建一个能够泛化于多样化场景的图基础模型。其核心挑战在于如何将图数据与语言空间进行有效对齐，从而使 LLMs 更好地理解图结构。作为一种主流范式，图标记化大语言模型（Graph-Tokenizing LLMs，GTokenLLMs）将复杂结构和长文本编码为图标记序列，并通过语言指令微调将其与文本标记进行对齐。尽管取得了初步成功，我们基于信息论的分析表明，现有 GTokenLLMs 仅依赖语言指令提供的文本监督，实现的只是隐式的图–文对齐，容易导致文本主导的偏置，从而未能充分利用图上下文信息。为克服这一局限，我们首先证明，对齐目标的上界由输入图与其在 LLM 中的隐表示之间的互信息所限定，这一结论促使我们通过提升该上界来实现更优的对齐效果。基于此，我们进一步提出了一种重构式的图指令微调流程 RGLM。其核心思想是从 LLM 的图标记输出中重构图信息，将图监督显式引入对齐过程，以约束并增强对齐效果。在技术实现上，我们从两个互补视角探索了三种不同的变体来具体化 RGLM：输入空间中的 RGLM-Decoder，以及潜在空间中的 RGLM-Similarizer 和 RGLM-Denoiser，并分别对各变体的对齐有效性进行了理论分析。大量基准数据集和多种任务场景下的实验结果验证了所提出 RGLM 的有效性，为 GTokenLLMs 的对齐研究开辟了新的方向。

FRiskGPT: A Generative Foundation Model for Financial Risk Detection Zhongjian Zhang, Mengmei Zhang, Dehua Xu, Rongjun Shi, Jianfeng Liu, Fuli Meng, Huajian Xu, Xiao Wang, Ruijia Wang, Junze Chen, Minwei Tang, Chuan Shi

摘要：在线支付服务的快速发展加剧了金融风险，而现有模型通常将每一种风险实例孤立地进行检测，忽略了用户全生命周期中风险之间及风险内部的依赖关系，导致风险识别效果受限、智能能力碎片化。为克服这一局限，我们从统一建模的视角重新审视金融风险建模问题，提出了 FRiskGPT——首个面向金融风控的生成式基础模型。该模型将用户数据与标签数据重新定义为一种通用行为语言（General Behavior Language），并将多样化的风控任务统一为“下一行为预测”问题。具体而言，FRiskGPT 将用户特征与标签分解为用户行为和系统行为，重新激活其时间属性；随后通过通用行为的自回归建模进行训练，即在给定所有历史行为的条件下预测下一步行为。最终，在各个下游风险检测任务中，FRiskGPT 无需微调即可在任务约束的行为空间内直接预测风险的存在。大量实验结果表明，与现有最先进方法相比，FRiskGPT 在 6 个真实世界风控任务上平均性能提升达 12.8%，并展现出良好的规模化潜力。此外，FRiskGPT也已在中国电信翼支付风控系统中落地应用。

欢迎感兴趣的朋友进一步阅读原论文了解具体内容，后续也将为这些论文推出详细解读的文章～

本期责任编辑：杨成

本期编辑：郭枫&赵明宇

北邮 GAMMA Lab 公众号

主编：石川

责任编辑：杨成

编辑：郭枫&赵明宇

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：北邮 GAMMA Lab 郭枫&赵明宇郭枫&赵明宇《快讯｜北邮GAMMA LAB四篇工作被WWW 2026录用》