PulseAugur
实时 04:32:33
实体 PrefBench

PrefBench

PulseAugur coverage of PrefBench — every cluster mentioning PrefBench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_48714 ·

    LLM代理在隐藏偏好定价谈判中难以盈利

    研究人员推出了PrefBench,这是一个旨在评估大型语言模型(LLM)代理在买家偏好隐藏的个性化定价谈判中表现的新基准。虽然LLM代理在完成交易方面表现出很高的成功率,交易完成率超过0.99,但它们的盈利结果却明显较弱。表现最好的LLM代理的平均利润仅略好于随机基线,并且远低于简单的让步启发式方法,这表明在合规性和盈利性谈判之间存在差距。