文章总结: 华中科技大学团队提出SpotCC系统,解决AI预测服务在抢占式实例上的高延迟与高开销问题。通过局部性识别、跨可用区相关性分析及Q-learning自适应超时优化,SpotCC在阿里云实验中将P99尾延迟降低83.9%且维持低成本。该成果被HPCA2026录用,为AI服务低成本高可用部署提供了新方案。 综合评分: 83 文章分类: 云安全,AI安全,解决方案
华中科技大学胡燏翀教授指导的博士生王霖等的论文被会议HPCA 2026录用
信息网络安全杂志
2026年1月19日 17:01 上海
随着 AI 服务的蓬勃发展,预测服务系统(PSS)在抢占式实例(Spot Instances)上部署可大幅降低 GPU 计算成本,但频繁抢占导致编码计算(CC)面临高昂解码开销和尾延迟问题,现有方案难以兼顾成本与服务质量。
华中科技大学信息存储及应用实验室博士生王霖(第一作者)、硕士生段梓羚、博士生李茗畦等同学,在胡燏翀教授(通讯作者)等的指导下,提出 SpotCC:1)基于局部性的波动性识别方案(SpotCC-L),利用区域内抢占局部性快速标记易抢占区域;2)细粒度波动性识别方案(SpotCC-F),通过跨可用区相关性分析缓解原始任务拥堵;3)自适应剖析引导超时方案(SpotCC-A),基于 Q-learning 动态优化阈值,最小化解码操作。
实验团队基于 NVIDIA Triton 推理服务器上实现了 SpotCC原型系统。阿里云实验表明,与现有方案相比,SpotCC 的 P99 尾延迟最高降低 83.9%,同时保持超低部署成本,实现成本与性能的高效平衡。
该研究被 HPCA’26(CCF-A,录取率19.8%)录用,题目为:“SpotCC: Facilitating Coded Computation for Prediction Serving Systems on Spot Instances”。相关成果为 AI 预测服务的低成本高可用部署提供了新思路,得到了国家重点研发计划(No.2022YFB4501300)、国家自然科学基金(No.62272185)和教育部信息存储系统重点实验室的支持。
信息网络安全
《信息网络安全》创刊于2001年,是由公安部主管,公安部第三研究所、中国计算机学会主办,面向国内外公开发行的国内首批信息安全类期刊之一,于2015年成为中国科技核心期刊,2017年成为中国科学引文数据库来源期刊,2018年成为中文核心期刊,2022年入选CCF计算领域高质量科技期刊分级目录。
中文核心期刊
中国科技核心期刊
中国科学引文数据库来源期刊
CCF计算领域高质量科技期刊
我们在不断努力和完善中,期待您的关注和支持!
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:信息网络安全杂志 《华中科技大学胡燏翀教授指导的博士生王霖等的论文被会议HPCA 2026录用》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。









评论