研究人员开发了一个名为RMPL(面向关系的多任务渐进式学习)的新框架,以改进多媒体事件提取,该过程涉及从文本和图像中识别事件及其论元。该方法通过使用来自单模态事件提取和多媒体关系提取的异构监督进行分阶段训练,解决了标注训练数据稀缺的问题。在M2E2基准上的实验表明,RMPL在与多个Vision-Language Models (VLMs)结合使用时,能够持续提高各种模态设置下的性能。 AI
影响 引入了一种改进多模态数据中事件提取的新方法,有可能增强处理文本和图像的AI系统。
排序理由 这是一篇研究论文,详细介绍了一种针对特定NLP任务的新框架和方法论。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →