研究人员为AI合作中的奖励分配引入了一个新颖的框架,其中人类代理在不同的价值约束下贡献数据并参与模型更新。该系统被称为价值条件梯度过滤,仅奖励那些符合每个主体价值概况的更新。该方法利用在线边际贡献信号和遍历学习(TL)基底内的累积收入结算,提供了比FedAvg等传统联邦学习方法更精细的归因。 AI
影响 这项研究可能带来更公平、更高效的去中心化AI系统协作模型。
排序理由 该集群包含一篇详细介绍AI合作新框架的学术论文。
在 arXiv cs.MA (Multiagent) 阅读 →
- AI cooperatives
- cumulative revenue settlement
- Data valuation
- FedAvg
- federated contribution estimation
- federated learning
- online marginal contribution signals
- Personalized Federated Learning for Intelligent IoT Applications: A Cloud-Edge based Framework
- Pluralistic Alignment
- traversal learning (TL)
- value-conditioned gradient filtering
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →