PulseAugur
实时 10:46:01
实体 FGRPO

FGRPO

PulseAugur coverage of FGRPO — every cluster mentioning FGRPO across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_68474 ·

    联邦GRPO框架增强了去中心化模型微调的隐私性

    研究人员开发了FGRPO,一个用于联邦学习的新框架,它能够在保护数据隐私的同时,实现推理模型的去中心化微调。该方法通过使用组相对策略优化(GRPO)来解决因集中来自分布式所有者的数据而带来的隐私风险。FGRPO包含一个自适应聚合机制,用于管理因不同任务奖励尺度变化引起的不稳定性,确保在非独立同分布(non-IID)数据上的稳健收敛。