PulseAugur
实时 22:52:12
实体 Yu Zhu

Yu Zhu

PulseAugur coverage of Yu Zhu — every cluster mentioning Yu Zhu across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_68372 ·

    新基准评估LLM谈判能力,GPT-5媲美人为基线

    研究人员推出了PieArena,这是一个旨在评估大型语言模型谈判能力的新基准。该基准利用了从MBA谈判课程改编的真实场景,并在包括人机交互在内的各种配对模式下评估模型。评估超越了简单的结果分数,提供了多维度的行为画像,考察了指令遵循、欺骗和声誉等方面。值得注意的是,一个前沿模型GPT-5在这些谈判任务中的表现与人类基线相当或更优。

  2. TOOL · CL_51133 ·

    TARQ框架通过残差量化提升推荐系统预排序性能

    研究人员开发了TARQ,一个用于推荐系统的新预排序框架,旨在提高效率和有效性。TARQ通过残差量化(Residual Quantization)整合了类似目标注意力(Target Attention)的架构,将先进的建模能力引入预排序阶段。这项创新已成功部署在淘宝上,服务数百万用户,并展示了显著的性能提升。