English(EN) Legal Domain Adaptation of Modern BERT Models

适配法律领域的现代BERT模型表现出显著的性能提升

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

研究人员调查了现代BERT模型在法律领域的领域适应性。通过在美国法院判决书的大型语料库上使用掩码语言模型进行进一步预训练，与原始模型相比，他们在法律数据集上取得了显著的性能提升。这种方法，即在现有检查点上进行进一步预训练而不是从头开始训练，使得模型能够处理多达8,192个标记，并为法律文本生成有意义的嵌入。开发的模型现已公开提供。 AI

影响增强了法律专业人士的专业AI能力，可能改进法律研究和文件分析。

排序理由该集群包含一篇学术论文，详细介绍了将现有语言模型适配到特定领域的研究。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Dominik Stammbach, Peter Henderson · 2026-06-30 04:00

现代BERT模型在法律领域的自适应

arXiv:2606.28538v1 Announce Type: new Abstract: We investigate domain adaptation of modern BERT models in the legal domain. We further pre-train ModernBERT on all US court opinions using the masked language modeling objective. Although ModernBERT has been trained on roughly 500x …

报道来源 [1]

现代BERT模型在法律领域的自适应

相关实体

相关话题