PulseAugur
实时 12:19:44
实体 UA-Legal-Bench

UA-Legal-Bench

PulseAugur coverage of UA-Legal-Bench — every cluster mentioning UA-Legal-Bench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_56197 ·

    新基准评估 LLM 在跨司法管辖区的法律推理能力

    研究人员开发了新的基准来评估大型语言模型(LLM)在不同司法管辖区和语言中的法律推理能力。UA-Legal-Bench 专注于乌克兰法律,利用大量的法院判决语料库来执行案件类型分类和规范提取等任务。Multi-Legal-Bench 通过在六个国家/地区评估相同的任务来扩展这一研究,揭示了少样本提示(few-shot prompting)的效果是一致的,但模型性能因司法管辖区和语言而异。此外,BenGER 平台和数据集评估了 LLM …