PulseAugur
实时 14:04:05
实体 Mingqiao Zhang

Mingqiao Zhang

PulseAugur coverage of Mingqiao Zhang — every cluster mentioning Mingqiao Zhang across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_53891 ·

    LLM推荐基准因数据泄露而受损

    一篇新发表在arXiv上的研究论文指出了评估大型语言模型(LLMs)在推荐系统中的一个重大问题,称为“基准数据泄露”。当LLMs在训练阶段无意中记住基准数据集时,就会发生这种情况,导致性能指标虚高,未能反映真实能力。模拟数据泄露的实验表明,与领域相关的泄露数据会导致实质性但虚假的性能提升,而与领域无关的数据则会降低准确性。