PulseAugur
实时 09:54:29
实体 foundation model agents

foundation model agents

PulseAugur coverage of foundation model agents — every cluster mentioning foundation model agents across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_48891 ·

    新的MARGIN方法实时校准基础模型智能体

    研究人员开发了一种新的在线校准方法MARGIN,旨在提高多智能体系统中基础模型智能体的可信度。与需要模型访问和固定数据集的传统方法不同,MARGIN直接从任务流中实时学习校准因子,无需重新训练或使用保留数据。在19个模型和8个基准上的实验表明,MARGIN在分布变化下显著降低了校准误差,并提高了协调器选择最准确智能体响应的能力,在某些情况下甚至优于随机选择和表现最佳的单一模型。