PulseAugur
实时 13:47:19
实体 Jun-Yu Ma

Jun-Yu Ma

PulseAugur coverage of Jun-Yu Ma — every cluster mentioning Jun-Yu Ma across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_65856 ·

    新基准揭示大型语言模型在双向知识编辑方面存在困难

    研究人员引入了一个名为BAKE(Bidirectional Assessment for Knowledge Editing)的新基准,用于评估大型语言模型保留编辑后信息的能力。研究发现,虽然模型可以回忆新插入的事实,但它们常常无法正确回忆编辑的反向信息。这种“逆转诅咒”凸显了当前模型编辑技术的一个重大缺陷,即使在使用如上下文学习(In-Context Learning)等方法时,这些方法虽然有所缓解,但仍存在局限性。