研究人员开发了RoTRAG,一个旨在增强多轮对话中有害内容检测能力的新型框架。该系统通过整合人工制定的道德规范(称为经验法则,RoTs)来增强检索增强生成,为推理提供明确的规范性证据。RoTRAG还包含一个轻量级分类器,可高效判断何时需要基于检索的推理,从而减少冗余计算。在基准数据集上的实验表明,与现有方法相比,在危害分类和严重性估计方面有了显著改进。 AI
影响 该框架有望为内容审核和安全领域带来更可靠、更具可解释性的AI系统。
排序理由 该集群描述了一篇在arXiv上发表的研究论文,详细介绍了一个新AI框架。[lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- Hugging Face
- ProsocialDialog
- RoTRAG
- Rules of Thumb: An Investigation Into The Potential Of Contextual Transposition In Social Design
- Safety Reasoning Multi Turn Dialogue
- Wonduk Seo
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →