研究人员开发了一种名为Citation Grounding (CG) 的新指标,用于检测和减少大语言模型 (LLM) 在生成法律引文时出现的幻觉。该指标在大量乌克兰法院判决数据集上进行了测试,将幻觉分解为精确性、相关性和时间性问题。为了在没有人工标注的情况下解决这些问题,他们还引入了Citation Grounding DPO (CG-DPO),一种使用算法生成的偏好对来微调大语言模型的方法,在区分正确引文和错误引文方面取得了高准确率。 AI
影响 引入了一个新颖的评估框架,用于评估大语言模型在法律引文方面的准确性,有望提高法律人工智能应用的可靠性。
排序理由 学术论文,介绍了一种用于评估大语言模型安全性的新指标和方法。[lever_c_demoted from research: ic=1 ai=1.0]
- Amazon Nova Pro/Lite
- Citation Grounding
- Citation Grounding DPO
- Claude Haiku 4.5
- Large Language Models
- Mistral Pixtral Large
- Qwen2.5-7B-Instruct
- Ukrainian court decisions
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →