2026-01-05 18:12:08 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 北京大学姜欣睿论文被KDD2026录用，提出CAVIAR框架解决微服务根因分析难题。该方法结合VAE与ICA将高维指标解耦为潜在因子，通过干预矩阵定位故障源。实验表明其在大规模数据集上准确性优于现有方法，且无需预筛选指标，显著提升了故障诊断的效率与可解释性。 综合评分： 100 文章分类： AI安全,安全运营

cover_image

北京大学博士研究生姜欣睿论文被数据挖掘领域顶会KDD 2026录用

信息网络安全杂志

2026年1月4日 17:02 上海

近日，北京大学智能计算与感知实验室博士研究生姜欣睿同学作为第一作者投稿的论文“CAVIAR: Disentangling Root Causes with an ICA-based VAE for Large-Scale Microservice Systems”被KDD 2026录用。该论文的指导老师为智能计算与感知实验室马萌副研究员与王平教授。

现代微服务架构在带来部署灵活性的同时，也产生了海量的异构监控数据，使得故障诊断变得异常困难。传统的根因分析（RCA）方法在面对高维、多源的复杂数据时，往往面临可扩展性差、依赖人工筛选指标等瓶颈，难以在成千上万个指标中快速精准地定位故障源。

针对这一挑战，我们提出了一种基于因果分析的创新框架CAVIAR（Causality-based Analysis via VAE and ICA for Anomaly Root-cause）。如图一所示，CAVIAR采用两阶段设计：首先，通过融合独立成分分析（ICA）的变分自编码器（VAE），将大规模异构指标解耦为低维、语义清晰的潜在因子（如特定的“服务负载”或“网络状态”），从而学习系统的正常运行模式；其次，在故障发生时，将异常视为对某一潜在因子的外部“干预”，通过优化干预矩阵来锁定故障维度，并将其映射回原始物理指标，实现可解释的根因定位。

图一 CAVIAR根因分析框架概览

CAVIAR在工业级数据集IBM_Cloud和包含超过1300个指标的大规模公开数据集LEMMA上进行了广泛验证。实验结果表明，CAVIAR在准确性上显著优于RUN、CausalRCA等现有最先进方法，并且是少数能在不进行指标预筛选的情况下处理大规模高维数据的方法。此外，CAVIAR通过潜在空间的可视化（如图二所示），能够清晰地揭示故障在微服务间的传播路径，为运维人员提供了直观、可操作的诊断解释。

图二 CAVIAR在LEMMA数据集上的故障干预矩阵可视化与指标归因

ACM SIGKDD（International Conference on Knowledge Discovery and Data Mining）是数据挖掘与知识发现领域的国际顶级会议，也是中国计算机学会（CCF）推荐的A类会议，享有极高的学术声誉。KDD 2026将于2026年8月在韩国举办。

来源：智能计算与感知实验室

信息网络安全

《信息网络安全》创刊于2001年，是由公安部主管，公安部第三研究所、中国计算机学会主办，面向国内外公开发行的国内首批信息安全类期刊之一，于2015年成为中国科技核心期刊，2017年成为中国科学引文数据库来源期刊，2018年成为中文核心期刊，2022年入选CCF计算领域高质量科技期刊分级目录。

中文核心期刊

中国科技核心期刊

中国科学引文数据库来源期刊

CCF计算领域高质量科技期刊

我们在不断努力和完善中，期待您的关注和支持！

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：信息网络安全杂志《北京大学博士研究生姜欣睿论文被数据挖掘领域顶会KDD 2026录用》