佛罗里达大学 Gators 研究人员赢得了美洲NLP 2026土著语言文化图像字幕生成共享任务。他们的两阶段系统使用 Qwen2.5-VL 生成中间西班牙语字幕,然后使用带有检索增强提示的 Gemini 2.5 Flash 进行最终翻译。该提交在某些语言上展示了显著的性能提升,超过 150%,并成为比赛的总体获胜者。 AI
影响 展示了针对低资源语言的先进多模态AI能力,可能有助于文化保护和可访问性。
排序理由 学术论文,详细介绍了针对土著语言的图像字幕生成新方法并赢得共享任务。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →