研究人员开发了一种新方法,使用强化学习和链式思考(CoT)监督来改进仇恨和宣传表情包的检测和解释。该方法通过优化分类准确性和生成解释的质量来增强多模态大型语言模型(MLLMs)。在英语和阿拉伯语基准上的实验显示,准确性显著提高,并通过自然语言理由提供了更均衡的每类性能。 AI
影响 这项研究提供了一种新颖的方法来增强AI识别和解释表情包中有害内容的能力,有可能改进内容审核系统。
排序理由 该集群包含一篇详细介绍AI模型训练新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- Arabic
- English
- Group Relative Policy Optimization
- Hateful and Propagandistic Memes
- Hateful Memes
- Mohamed Bayan Kmainasi
- Multimodal Large Language Models and Tunings: Vision, Language, Sensors, Audio, and Beyond
- reinforcement learning
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →