PulseAugur
实时 09:07:30
实体 Xuelin Zhang

Xuelin Zhang

PulseAugur coverage of Xuelin Zhang — every cluster mentioning Xuelin Zhang across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_68373 ·

    SHARP框架利用Shapley信用优化多智能体LLM训练

    研究人员开发了一个名为SHARP的新框架,以改进集成大型语言模型和外部工具的多智能体系统的训练。该方法解决了将功劳归于个体智能体以取得成功结果的挑战,这对于高效学习至关重要。SHARP利用分解奖励机制,包括基于Shapley的边际信用奖励,以精确归因贡献并稳定训练。实验表明,SHARP的性能显著优于现有方法,在准确性和效率方面取得了实质性改进。