研究人员推出了一种新颖的框架TL++,专为需要在不集中原始数据的情况下跨不同数据孤岛训练模型的分布式智能系统而设计。该系统提供两种模式:一种基础模式,通过交换切层激活和梯度来模拟集中式小批量梯度行为;另一种安全模式,将这些张量在协调器和助手之间进行秘密共享,以防止明文数据被观察到。在CIFAR-10和BioGPT/PubMedQA数据集上的评估表明,TL++在准确性方面显著优于现有的联邦学习和拆分学习方法,同时大大降低了通信开销。 AI
影响 该框架可以实现跨去中心化数据集的更高效和私密的AI模型训练,从而可能加速敏感数据领域的研发。
排序理由 该集群包含一篇详细介绍分布式AI训练新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- BioGPT: generative pre-trained transformer for biomedical text generation and mining
- CIFAR-10
- Lora
- PubMedQA
- TL++
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →