PulseAugur
实时 13:53:33
English(EN) EURO-5K: When Does Domain Pretraining Matter? Benchmarking Transformers for EU Reporting Obligation Extraction

新数据集和模型助力欧盟报告义务提取

研究人员开发了 EURO-5K,一个用于从欧盟立法中提取报告义务的新数据集,这对于合规自动化至关重要。他们使用全参数微调和参数高效的 QLoRA 方法,比较了包括 BERT 和 LLM 在内的 Transformer 模型。结果表明,在句子级别提取方面,完全微调的通用和法律 BERT 模型表现与微调的 LLM 相当,法律预训练对生成模型的好处不大,但对参数高效微调有显著优势。 AI

影响 提供了一个专门的数据集并评估了用于自动化监管合规性的模型,有可能减轻在欧盟运营的企业的负担。

排序理由 学术论文,介绍了一个新数据集并评估了 NLP 模型。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Marios Koniaris, Vasileios Kotronis, Eugenia Giannini, Panayiotis Tsanakas ·

    EURO-5K:领域预训练何时重要?用于欧盟报告义务提取的 Transformer 基准测试

    arXiv:2606.02971v1 Announce Type: new Abstract: Extracting reporting obligations from EU legislation is critical for assessing and reducing regulatory reporting burden. However, distinguishing reporting requirements from structurally similar provisions requires specialised legal …