文章总结: 本文提出DHFL分布式分层联邦学习框架,将全局聚合迁移至雾层并利用MCPSO算法动态选择节点,解决了传统框架延迟高与中心化依赖问题。通过引入数据质量指数与贡献分数优化权重,实验证明该方法在非独立同分布数据下显著提升了模型精度、收敛速度与资源效率。 综合评分: 84 文章分类: AI安全,数据安全,解决方案
每周文章分享-249
网络与安全实验室
2026年3月1日 08:38 江苏
每周文章分享
2026.02.23至2026.03.01
标题:DHFL: Decentralized Hierarchical Federated Learning with Dynamic Global Aggregation for Privacy-Aware Fog Computing
期刊: IEEE Transactions on Consumer Electronics VOL. 71, NO. 2, MAY 2025
作者:Tariq Qayyum,Zouheir Trabelsi,Asad Waqar Malik,Asadullah Tariq,and Irfanud Din
分享人: 河海大学——张宇
01 研究背景
在物联网技术快速发展的当下,海量分布式数据催生了对低延迟、隐私保护的机器学习需求,联邦学习(FL)作为分布式训练范式,通过本地训练、参数聚合实现数据隐私保护,但传统FL依赖云端集中聚合导致通信延迟过高,分层联邦学习(HFL)虽引入雾节点局部聚合,仍未摆脱对云端全局聚合的依赖,且存在固定聚合节点适应性差、非独立同分布(non-IID)数据处理低效、资源利用不均衡等问题,难以满足医疗监测、工业自动化等延迟敏感型应用需求;本文旨在解决传统FL及HFL框架中通信延迟高、中心化依赖强、数据质量与节点贡献未被充分考虑的核心问题。
02 关键技术
本文介绍了一种新的分布式分层联邦学习(DHFL)框架,该框架将全局聚合从云层转移到雾层,根据数据质量、工作负载、通信成本和可用性等指标动态选择最佳的雾节点进行聚合。在该框架中,采用增强型多准则粒子群优化算法(MCPSO)来优化聚合节点的选择,以最小化延迟并提高资源利用率。
该框架的创新和贡献如下:
1.聚合层迁移:将全局聚合从云端完全转移至雾层,消除雾节点与云端的双向通信延迟,实现“边缘侧局部聚合+雾层全局聚合”的双层架构。
2.动态聚合节点选择:基于数据质量、通信成本、工作负载、节点可用性等多维度指标,动态选择最优雾节点作为全局聚合节点,而非依赖固定节点。
3.多准则优化算法:设计增强型多准则粒子群优化(MCPSO)算法,优化聚合节点选择过程,实现延迟最小化和资源利用率最大化。
加权聚合机制:在局部和全局聚合中融入数据质量指数(DQI)和客户端贡献分数,提升non-IID数据场景下的模型性能。
03 算法介绍
图1展示了DHFL的系统模型,DHFL包括三个层面,分别为客户端层、雾层、云层。
客户端层由大量IoT设备(如可穿戴健康监测仪、车载传感器等)组成,每个客户端C_j拥有本地数据集D_i。客户端层主要执行本地模型训练,计算损失函数L_i(θ);评估数据质量指数(DQI)和贡献分数η_i等指标,这些参数指标随后被发送至关联雾节点。
雾层包含n个雾节点,每个雾节点f_j连接子集客户端。雾层接收客户端数据并执行本地加权聚合(基于DQI和贡献分数);定期向云层发送轻量级心跳消息H_j={C_j,W_j, A_j,平均DQI_j, 平均η_j}(包含通信成本、工作负载、可用性等指标)并封装与客户端相关联的平均DQI和平均贡献函数。被选为全局聚合节点的雾节点将执行全局聚合,并将全局模型分发至其他雾节点,随后发送给客户端进行下一步训练。
云层接收雾节点心跳消息,通过MCPSO算法动态选择最优全局聚合雾节点;向所有雾节点广播最优聚合节点地址,协调全局聚合流程。
图1:DHFL系统框架
A. 数据质量指数(DQI)计算
在本文提出的框架中,数据质量指数(DQI)是选择最佳聚合节点的关键参数。具有更高数据质量的客户端被分配更大的信任,这也反映在其连接的雾节点上。DQI是包括类别平衡、熵、噪声水平、冗余度和清晰度分数的复合度量,每个分量归一化到的范围。本文根据这些组件对聚合稳健性和模型性能的相对影响为其分配权重。权重经过经验调整以优化数据多样性、可靠性和聚合效率之间的平衡,确保高质量数据对全局模型的精度具有一定的比例影响,DQI的计算公式为
其中a、b、r分别为表示这些参数重要性的可调权重。
B. 客户端贡献分数计算
基于模型性能指标(准确率、精确率、召回率、F1分数)加权计算客户端的贡献分数:
其中w_a,w_p,w_r,w_f分别为对应模型性能的权重值
C. 雾节点操作
①本地聚合算法
雾节点从客户端接收本地模型、数据质量指数和贡献分数。一旦雾节点从其所有客户端接收到|C_j|数量的更新,它就启动本地加权聚合算法:
其中W_DQI,W_η是为数据质量赋予权重的常量,0<=W_DQI,W_η<=1,
②雾节点定期向云层发送心跳信息
并行地,每个雾节点定期向云服务器发送心跳消息H_j={C_j,W_j, A_j,平均DQI_j, 平均η_j}。该心跳消息包含其所有客户端的平均数据质量指数和平均贡献分数、通信成本C_j、可用性A_j和雾节点处的工作负荷W_j。客户端平均数据质量是每个连接到雾节点客户端数据质量总和与客户端总数的比值,客户端平均贡献分数是每个连接到雾节点客户端贡献分数总和与客户端总数的比值。
雾节点j的总通信延迟为:
其中T_j、k为雾节点J和k(j、k属于同一个雾节点集合)之间的通信延迟:
雾节点j的工作负载计算公式为
公式中CPU_j,M_j,IO_J,C_J,C_max,Q_j,Q_max分别表示当前的CPU使用率、内存使用率、磁盘读写操作数,活跃客户端数量,最大客户端数量、任务队列长度和最大允许任务队列长度。权值_i,i=1,2,3,4,5是可调参数,可以根据系统需求或资源优先级进行调整。
本文假设雾节点是静态的和固定的,从而消除了与移动性相关的复杂性。此外,本文考虑一种可信环境,假设所有节点都经过身份验证并且是安全的。雾节点j的可用性的计算公式为:
其中β_1· R_j 和β_2· E_j分别为雾节点j的可靠性和能级消耗及其权重,工作量的比例因子由λ表示,以惩罚工作量。雾节点的可靠性R_j通过加权计算雾节点j在线的总时间与被监控的时间的比值,成功处理的任务与处理的总任务的比值以及节点故障率这三个可靠性因素来获得。雾节点的能级则是使用连续和基于电池的能量源来计算的。
D. 全局聚合算法
本文所提出的框架将全局聚合转移到雾节点之一,称为最佳雾节点。云端通过解决多目标优化问题,利用来自雾节点的周期性心跳消息来动态确定该节点。最优雾节点基于各雾节点的平均DQI和平均贡献分数进行全局加权聚合。全局聚合算法为:
E. MCPS0动态节点选择算法
云层的优化问题是在综合考虑数据质量、贡献度、通信成本、工作量、可用性等多个性能因素的基础上,选择最佳雾节点f_j进行全局聚合。该优化函数表示为
为了有效地解决优化问题,动态选择最佳雾节点,本文采用了一种改进的多准则粒子群算法。与传统的只优化单一目标的PSO不同,MCPSO结合了数据质量、贡献分数、通信成本、工作负载和可用性等多个指标,以确保在准确性、延迟和资源利用率之间取得平衡。优化函数中定义的适应度函数基于这些标准评估每个候选节点。MCPSO算法遵循一个结构化的过程,其中每个粒子代表一个潜在的雾节点及其位置编码和适应度分数。
该算法初始化一组具有随机位置和速度的粒子。每个粒子基于其个人最佳位置和全局最佳位置通过下列公式
来更新其速度。其中ω是惯性权重,ϕ_1和ϕ_2是加速系数,r_1,r_2~U[0,1]是确保随机探索的随机向量。粒子下一时刻的位置被更新为当前时刻的位置加下一时刻的速度。动态调整惯性权重ω以平衡探索与采用,当达到最大迭代或全局最佳适应度值的变化低于预定义值时,算法收敛。这保证了算法在没有过度迭代的情况下稳定在最优或近似最优解。其算法的伪代码如图2所示。
图2:增强型MCPSO算法伪代码
04 实验结果分析
1. 实验设置
本文使用基于CNN的网络模型进行实验,实验使用MNIST、CIFAR-10、FashionMNIST、SVHN和KMNIST 5个数据集对所提出的框架进行了基准测试。数据集以non-IIID方式分布在客户端中,并以70/30的比例进行分割,用于在每个客户端进行培训和测试。
图3展示了在这些数据集上100个训练轮的准确率、精确度、召回率和F1分数。结果所示本文提出的DHFL框架在MNIST和KMNIST数据集上的性能明显更好。它在FashionMNIST和SVHN数据集上的表现也很好,但在CIFAR10数据集上表现不佳。在许多现有的框架中也观察到了类似的模式,在CIFAR数据集上的性能往往不是最优的。
图3:评估DHFL在100轮训练后的性能
图4展示了本文提出的DHFL在准确度、精确度、召回率和F1分数方面明显优于HFL。在所有这些指标上,本文的方法获得了比HFL高10-12%的性能,
图4:DHFL与HFL在四种不同性能指标下的对比
图5中的Loss轨迹表明了本文所提出的DHFL框架在五个数据集上100个训练轮的性能。该框架在MNIST、KMNIST、FashionMNIST和SVHN上实现了快速收敛和最小损失,展示了其在这些数据集上的鲁棒性。
图5:DHFL在100轮训练上的Loss轨迹
图6比较了DHFL和HFL在数据集MNIST和CIFAR10上的Loss轨迹。结果表明,在整个训练过程中,DHFL始终比HFL获得更低的损失,DHFL表现出更大的稳定性和收敛性。这些发现突出了DHFL加权聚合方法的有效性,该方法利用数据质量和贡献分数来提高学习效率。
图6:DHFL与HFL在100轮训练上的Loss轨迹对比
表1所示的敏感性分析评估了通信成本(w_1)、工作负载(w_2)、可用性(w_3)、数据质量(w_4)和贡献分数(w_5)等参数的不同权重对准确性和通信延迟的影响。增加w_4(数据质量)和w_5(贡献分数)的权重可以显著提高模型精度,分别提高4%和3%,因为它们强调聚合过程中更高质量的数据和有意义的贡献。
表1:参数敏感性分析
05 总结
本文提出了在雾层动态选择聚合节点的分布式分层联邦学习框架。DHFL通过数据的质量及贡献评分来实现更好的本地聚合和全局聚合,并提高non-IID设置中的模型性能。聚合节点选择采用增强型多准则粒子群优化算法(MCPSO)完成,且在资源利用方面减少了时延,提高了效率。实验结果表明,与传统的HFL框架相比,该框架在精度、收敛速度和通信效率方面都有显著提高。
END
==河海大学网络与安全实验室==
微信搜索:Hohai_Network
联系QQ:1084561742
感谢关注!
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:网络与安全实验室 《每周文章分享-249》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。








评论