PulseAugur
实时 22:46:33
实体 Legit

Legit

PulseAugur coverage of Legit — every cluster mentioning Legit across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_14492 ·

    新的LEGIT数据集使用问题树评分标准评估LLM法律推理

    研究人员开发了LEGIT,这是一个包含24,000个法律推理实例的新数据集,旨在评估LLM生成的法律论证的质量。该数据集将法院判决转化为论证和结论的层级树,作为评估推理痕迹的评分标准。使用LEGIT进行的实验表明,LLM的法律推理受到问题覆盖率和正确性的显著影响,并且检索增强生成(RAG)和强化学习(RL)提供了互补的优势,RAG增强了整体能力,而RL以覆盖率为代价提高了正确性。