EuroSys'25丨南京大学研究团队提出 PrioPlus,破解数据中心优先级队列受限难题
数据中心网络流量复杂、对性能要求极高,而交换机优先级队列数量十分有限。
南京大学研究团队另辟蹊径,将虚拟优先级与拥塞控制深度结合,提出PrioPlus算法。该方案无需改造硬件,就能实现高效流量调度,既保障高优先级业务,又提升整体带宽利用率,在作业完成效率上取得显著优化。
这篇研究“Enabling Virtual Priority in Data Center Congestion Control”发表在 EuroSys '25上,并荣获 Best Student Paper Award!
Enabling Virtual Priority in Data Center Congestion Control
作者:Zhaochen Zhang,Feiyang Xue,Keqiang He,Zhimeng Yin,Gianni Antichi,Jiaqi Gao,Yizhi Wang,Rui Ning,Haixin Nan,Xu Zhang,Peirui Cao,Xiaoliang Wang,Wanchun Dou,Guihai Chen,Chen Tian(南京大学;上海交通大学;香港城市大学;米兰理工大学 & 伦敦玛丽女王大学)
在数据中心网络中,各类具有严格性能要求的流量并行传输,需要通过优先级队列实现有效的隔离与调度。然而,多数交换机仅支持约十个优先级队列。虚拟优先级可在单一物理队列上模拟多优先级队列,从而突破这一限制,但现有方案通常需要复杂的交换机级调度与硬件改造。
本研究核心思路是:虚拟优先级可通过精细调控物理队列中的带宽竞争实现,而该过程传统上由拥塞控制(CC)算法完成。因此,虚拟优先级机制需与 CC 紧密结合。本研究提出PrioPlus算法,一种可与现有拥塞控制方案集成的增强型算法,能够实现虚拟优先级传输。PrioPlus为不同优先级分配特定时延区间,确保流仅在时延处于指定区间时传输,从而有效满足虚拟优先级需求。
与采用物理优先级队列的Swift CC相比,PrioPlus可在不显著影响性能的前提下,为高优先级流提供严格优先级保障。同时,其优先级感知设计可在高优先级流量传输完成后,提升CC对可用带宽的充分利用能力,使低优先级流性能提升25%至41%。在协同流与模型训练场景下,相较于采用物理优先级队列的 Swift,PrioPlus 可分别将任务完成时间缩短 21%与 33%。
图片说明:基于现有CC实现虚拟优先级的微型基准测试。
图片说明:不同优先级与流大小下的FCT分解,以Physical*+Swift的FCT为基准进行归一化。
doi.org/10.1145/3689031.3717463
📢 免责声明
本文仅为对该研究文献内容的摘抄,如需了解更多信息请查看原文。研究文献中的内容和观点均属于作者,我们不对上述观点和言论承担责任
长按二维码|关注我们
随时了解 ACM 定期推出的出版物和会议信息更新