研究人员开发了FGRPO,一个用于联邦学习的新框架,它能够在保护数据隐私的同时,实现推理模型的去中心化微调。该方法通过使用组相对策略优化(GRPO)来解决因集中来自分布式所有者的数据而带来的隐私风险。FGRPO包含一个自适应聚合机制,用于管理因不同任务奖励尺度变化引起的不稳定性,确保在非独立同分布(non-IID)数据上的稳健收敛。 AI
影响 增强了去中心化AI模型训练的隐私性,可能促成在敏感数据集上更广泛的协作。
排序理由 该集群包含一篇详细介绍联邦学习新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →