PulseAugur
实时 10:19:32
实体 Wang Yang

Wang Yang

PulseAugur coverage of Wang Yang — every cluster mentioning Wang Yang across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_70353 ·

    新基准测试100-LongBench旨在准确测试LLM长上下文能力

    研究人员推出了100-LongBench,这是一个旨在更准确地评估大型语言模型长上下文能力的新基准测试。现有的基准测试常常无法区分模型的通用知识与其处理扩展上下文的具体能力。新基准测试包含一个长度可控的系统和一个新颖的指标来区分这些因素,为比较不同的LLM提供了一种更清晰的方法。