研究人员推出了CULTURE-MT,这是一个旨在评估社交媒体上翻译的用户生成内容(UGC)的文化有效性的新基准。现有的翻译指标在评估UGC中存在的非正式语言、文化参考和情感共鸣的细微差别方面常常不足。CULTURE-MT基准包含14个领域的1002条UGC笔记,并提出“文化有效性”作为新的评估标准。通过测试15个模型,研究发现传统指标对于这项任务来说是不够的,并且较大的模型通常表现出更好的文化有效性。 AI
影响 该基准可能促成更具文化敏感性和更有效的社交媒体AI翻译系统。
排序理由 该集群包含一篇介绍特定AI任务新基准和评估方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →