文章总结: 北京邮电大学GammaLab等团队提出Gemir框架,通过图多任务学习联合建模芯片供电网络中的电迁移与电压降。该框架利用跨层注意力聚合、物理约束神经网络及冲突门控优化策略,实现了节点级IRdrop与边级EM应力的端到端精准预测,相比现有方法在精度与泛化性上取得显著提升,为芯片可靠性签核提供高效解决方案。 综合评分: 92 文章分类: 技术标准,解决方案,其他
DAC 2026 | GEMIR:基于图的片上供电网络电迁移与电压降联合建模优化
原创
郭枫 郭枫
北邮 GAMMA Lab
2026年4月2日 14:56 北京
在小说阅读器读本章
去阅读
近日,北京邮电大学GAMMA Lab联合北京邮电大学集成电路学院、香港中文大学合作完成的论文 GEMIR: Graph-Based Joint Modeling of Electromigration and IR Drop for Power Grid 被国际顶级设计自动化会议DAC 2026(CCF A 类)正式录用。
本文针对片上供电网络中电迁移(EM)与电压降(IR Drop)强耦合的核心物理特性,提出了一种基于图的多任务学习框架,首次实现了节点级静态IR Drop与边级EM诱导应力的端到端联合精准预测,解决了传统方法计算成本高、现有机器学习方法割裂物理相关性的行业痛点,为大规模工业芯片的电源完整性与可靠性签核提供了高效、高泛化性的全新解决方案。
论文基础信息
- 论文题目:GEMIR: Graph-Based Joint Modeling of Electromigration and IR Drop for Power Grid
- 作者:Feng Guo, Yueyue Xi, Jingyu Jia, Jiawei Liu, Tianshu Hou, Yuyang Ye, Jianwang Zhai, Kang Zhao, Chuan Shi
- 单位:北京邮电大学、香港中文大学
- 论文录用:DAC 2026 (CCF A类会议)
一、研究背景与核心挑战
随着半导体工艺持续微缩,芯片电源网格中的电迁移(EM)与电压降(IR Drop)问题,已成为制约芯片性能、可靠性与电源完整性的核心瓶颈。
电迁移是电流驱动下金属互连线内的原子迁移现象,会引发互连线空洞或丘状凸起,最终导致电路性能退化甚至失效;电压降是电流流经电源网格电阻产生的电压降,会直接破坏芯片电源完整性,引发功能故障。二者并非独立存在,而是形成了强耦合的正反馈循环:
- EM产生的空洞会迫使电流流入电阻更高的衬层,引发电阻跳变,进一步恶化IR Drop,最终可能导致电源传输系统失效;
- IR Drop引发的焦耳热会提升金属电阻率与局部电流密度,加剧电流拥挤效应,直接加速EM进程。
然而,现有解决方案始终无法有效应对这一耦合问题:
- 传统数值方法:依赖求解大规模线性方程组与偏微分方程(PDE),计算资源与时间成本极高,完全无法适配大规模工业设计,尤其难以应用于芯片早期设计阶段的快速迭代;
- 现有机器学习方法:绝大多数将IR Drop预测与EM分析拆分为两个独立任务,完全忽略了二者底层的物理结构关联与强耦合特性,导致预测精度、物理一致性与泛化能力严重受限;少数物理信息神经网络(PINN)方法,也未解决二者的联合建模核心问题。
因此,如何精准建模EM与IR Drop的相互依赖关系,同时兼顾物理可解释性、预测精度与计算效率,实现二者的端到端联合预测,成为先进工艺下芯片可靠性设计的核心挑战。
二、核心方法:GEMIR 框架
GEMIR是专为EM与IR Drop联合预测设计的图基多任务学习框架,核心包含四大创新设计:物理感知的电源网格图建模、跨层节点 – 边注意力聚合与跨任务消息传递机制、物理信息神经网络(PINN)融合模块、冲突门控(Conflict-Gated, CG)多任务优化策略。整体架构如下图所示:
GEMIR整体架构
3.1 物理感知的电源网格图构建
为了在图结构上统一表征IR Drop与EM的物理特性,本文首先将电源网格转化为有向图,并基于电路物理知识设计了节点与边特征体系。其中创新性地设计了两类位置编码:几何位置编码映射节点的芯片坐标,电气位置编码通过到最近电源端的前3条最短路径电阻,刻画节点的电气位置,完全贴合电源网格的物理特性。标签设计上,节点标签为对应位置的IR Drop,边标签为互连线5个等距采样点的EM应力值,实现细粒度的预测目标。
3.2 跨层节点 – 边注意力聚合与跨任务消息传递
为了建立节点级IR drop与边级EM应力的结构关联,本文设计了节点注意力聚合器(NAA) 与边注意力聚合器(EAA),并通过跨任务消息传递机制实现两个任务的表征深度交互。
- 节点注意力聚合器(NAA):联合学习节点与边特征,通过改进的图注意力机制,编码边的方向性与距离权重,动态调整邻域节点的注意力分配,精准刻画IR drop与EM的相互依赖关系,生成高质量的节点嵌入;
- 边注意力聚合器(EAA):基于GAT架构,聚合边两端节点与邻接边的信息,生成贴合EM物理特性的边嵌入;
- 跨任务消息传递:NAA的输出嵌入传入下一层EAA,EAA的输出嵌入也传入下一层NAA,形成双向的信息流通。这一设计让EM预测分支融入局部电压与电流上下文,精准捕捉焦耳热对应力的影响;同时让IR drop预测分支利用EM的高电流依赖特性,提升热点检测的精度。
为了避免多层图聚合带来的过平滑问题,模型拼接了三层NAA与EAA的输出嵌入,让模型自适应选择多尺度的邻域信息,保留关键的局部特征。
3.3 物理信息神经网络(PINN)融合
为了增强 EM 预测的物理一致性与模型可解释性,本文在边嵌入生成模块中集成了PINN架构。该模块以边特征嵌入为输入,通过MLP建模应力的非线性演化,不仅完成数据拟合,更显式编码了Korhonen PDE描述的原子通量守恒、应力传播等核心物理规律,确保生成的应力表征同时贴合观测数据与物理约束,从根本上提升了EM预测的可靠性。
3.4 冲突门控(CG)多任务优化策略
多任务联合学习的核心痛点,是两个任务在共享参数上的梯度并非始终对齐,简单叠加损失函数会引发梯度冲突,导致负向迁移,无法实现两个任务的同步最优。针对这一问题,本文提出了全新的冲突门控多任务优化策略。
3.4.1 复合损失函数设计
模型的优化目标由数据驱动损失与物理约束损失两部分构成:
- 数据驱动损失:基于均方误差(MSE)构建,包括IR drop预测损失L1与EM应力预测损失L2,确保预测值与真实标签对齐;
- 物理约束损失:嵌入核心物理定律,包括基尔霍夫电流定律(KCL)约束损失 L3(惩罚节点净电流不为0的违规预测)、稳态 Korhonen PDE 约束损失 L4(惩罚应力分布不符合物理规律的预测),从底层保证模型输出的物理一致性。
3.4.2 冲突门控更新规则
该策略的核心是根据两个任务梯度的对齐程度,自适应切换更新模式,最大化正向知识迁移,避免负向干扰:
- 任务级梯度统一:分别计算 IR 任务的完整梯度 gir(包含 L1+L3)与 EM 任务的完整梯度 gem(包含 L2+L4),完整表征每个任务的最优下降方向;
- 梯度协同性判断:通过两个梯度的内积 s=
判断协同性:内积非负代表梯度方向一致,存在协同效应;内积为负代表梯度冲突,存在负向迁移风险; - 自适应门控更新:梯度协同则融合两个梯度更新共享参数,强化共享表征学习;梯度冲突则两个分支分别用各自梯度独立更新,实现专项优化,避免相互干扰。
该策略仅在训练阶段使用,无推理开销,同时完美解决了多任务优化中的梯度冲突问题,实现了 IR 与 EM 两个任务的双向性能提升。
三、实验结果与分析
本文在 ICCAD2023 电源网格基准数据集上完成核心实验,并通过 IBMPG、Nangate 公开数据集验证模型的迁移泛化能力,对比了多任务 SOTA 方法与单任务 SOTA 方法,全面验证了 GEMIR 的优越性。
4.1 EM-IR 联合预测主实验
在 ICCAD2023 数据集的 10 个真实测试用例上,GEMIR 在所有测试用例中均实现了最低的 IR drop MAE 与 EM 应力 RMSE,同时保持了极高的推理效率。
相比多任务 SOTA 方法 EMTM,GEMIR 实现了40.79% 的 IR drop MAE 平均降低与19.35% 的 EM 应力 RMSE 平均降低,且推理耗时无显著增加,充分证明了联合建模、物理约束与冲突门控策略的有效性。
4.2 单任务性能对比
本文进一步将 GEMIR 与 IR drop、EM 领域的单任务 SOTA 方法对比,验证了联合建模框架的通用性:
- IR drop 预测:相比图基 SOTA 方法 IRGNN、图像基 SOTA 方法 LaRED,GEMIR 在 MAE、F1 分数、皮尔逊相关系数、最大 IR drop 误差(MIRDE)上均取得了相当甚至更优的性能。其中 MIRDE 的显著降低,证明 GEMIR 能更精准地识别严重的 IR drop 热点,而 EM 辅助任务与 KCL 约束,帮助模型捕捉到了仅靠 IR 数据难以学习的电流拥挤区域。
- EM 应力预测:相比 EMGraph、HierPINN-EM 等单任务 SOTA 方法,GEMIR 实现了29.01% 的 RMSE 降低、25.64% 的平均错误率(MER)降低,拟合优度 R2 提升至 0.89,充分证明了 PINN 物理约束与 IR drop 辅助任务对 EM 预测精度的显著提升作用。
4.3 未见过设计的迁移性验证
在工业界实际签核流程中,训练数据有限、设计风格跨项目差异大是核心痛点。本文在 IBMPG 与 Nangate 数据集上进行迁移学习实验,验证模型的泛化能力:
即使在数据集结构差异极大的情况下,GEMIR 依然实现了精度的大幅领先,证明模型学习到了 EM 与 IR Drop 的底层物理规律,而非数据集特有的相关性,具备极强的工业落地潜力。
4.4 消融实验
本文通过消融实验,量化验证了每个核心模块的必要性:
- 取消IR Drop分支或EM分支,均会导致另一任务的性能显著下降,直接证明了两个任务联合建模的必要性,二者的监督信号可实现双向促进;
- 移除物理约束损失,模型精度大幅下滑,验证了 KCL 与 Korhonen PDE 约束对提升物理一致性和预测精度的关键作用;
- 移除冲突门控策略,仅用简单的损失相加训练,模型性能明显下降,证明了该策略能有效解决多任务优化中的梯度冲突问题。
五、结论
本文针对芯片电源网格中EM与IR Drop强耦合的核心特性,提出了GEMIR这一全新的基于图的多任务学习框架,实现了二者的端到端联合精准预测。论文的核心贡献可总结为三点:
- 首次提出了面向节点级IR Drop和边级EM应力联合预测的多任务图学习框架,通过跨层节点-边注意力聚合器与跨任务消息传递机制,精准捕捉了两个物理场的相互依赖关系;
- 设计了冲突门控多任务优化策略,自适应融合协同梯度、解耦冲突梯度,破解了多任务联合学习中的负向干扰难题,实现了两个任务的双向性能提升;
- 融合了嵌入KCL与Korhonen PDE的物理约束与PINN模块,大幅增强了模型的物理一致性与可解释性,同时保证了工业级的推理效率。
大量实验证明,GEMIR 不仅在联合预测任务上大幅超越现有多任务SOTA方法,在单任务上也匹配甚至超越了专用的单任务SOTA模型,同时展现出极强的泛化迁移能力,为先进工艺下大规模芯片电源网格的可靠性与电源完整性签核提供了全新的技术路径。
本期责任编辑:杨成
本期编辑:赵明宇
北邮 GAMMA Lab 公众号
主编:石川
责任编辑:杨成
编辑:赵明宇
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:北邮 GAMMA Lab 郭枫 郭枫《DAC 2026 | GEMIR:基于图的片上供电网络电迁移与电压降联合建模优化》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。









评论