研究人员开发了FedQueue,一种旨在优化跨多个高性能计算(HPC)设施的联邦学习的新型协议。该系统解决了批调度器队列造成的显著延迟,这些延迟可能占据训练时间的大部分。FedQueue结合了队列延迟预测和基于截止的准入机制来管理本地工作并缓冲迟到的更新,从而限制了更新的陈旧性。该协议还采用感知陈旧性的聚合来稳定异构工作负载,从而提高收敛速度并缩短训练时间。 AI
影响 在分布式HPC环境中优化联邦学习效率,可能缩短大规模AI模型的训练时间。
排序理由 这是一篇详细介绍联邦学习新协议的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →