PulseAugur
实时 11:05:01
实体 Kyubyung Chae

Kyubyung Chae

PulseAugur coverage of Kyubyung Chae — every cluster mentioning Kyubyung Chae across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_93497 ·

    新基准评估LLM在法律法规问答中的安全性和检索能力

    研究人员推出SearchFireSafety,一个旨在评估大型语言模型在以法规为中心的法律问答中性能和安全性的新基准。与以往侧重于判例法的基准不同,SearchFireSafety解决了从层级链接的法规文档中检索信息的挑战,并评估模型在上下文不足时弃答的能力。实验表明,虽然图引导检索提高了性能,但领域适应模型表现出关键的安全权衡,在缺少关键法规证据时更容易产生幻觉。