English(EN) DeEscalWild: A Real-World Benchmark for Automated De-Escalation Training with SLMs

新的基准数据集 DeEscalWild 训练小型语言模型用于警务降级

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-08 04:00

研究人员开发了 DeEscalWild，这是一个新的基准数据集和训练方法，用于小型语言模型 (SLMs)，旨在提高执法部门的降级技能。该数据集源自真实的警民互动，包含超过 285,000 个对话回合。实验表明，在 DeEscalWild 上微调的 SLMs 的表现明显优于其基础模型，甚至优于 Gemini 2.5 Flash 等通用模型，为基于边缘的训练提供了可扩展且计算效率高的解决方案。 AI

影响为执法部门的关键降级技能提供更易于访问的、实时的 AI 驱动培训途径。

排序理由这是一篇介绍新基准数据集并展示 SLMs 性能提升的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Md Hasebul Hasan, Krity Haque Charu, Eshwara Prasad Sridhar, Shuchisnigdha Deb, Mohammad A. Islam · 2026-05-08 04:00

DeEscalWild: A Real-World Benchmark for Automated De-Escalation Training with SLMs

arXiv:2604.13075v2 Announce Type: replace Abstract: Effective de-escalation is critical for law enforcement safety and community trust, yet traditional training methods lack scalability and realism. While Large Language Models (LLMs) enable dynamic, open-ended simulations, their …

报道来源 [1]

DeEscalWild: A Real-World Benchmark for Automated De-Escalation Training with SLMs

相关实体

相关话题