研究人员开发了新的方法来评估自然语言生成(NLG)和机器翻译(MT)系统。一种方法,“LLM作为元裁判”,使用大型语言模型创建合成数据集来验证评估指标,减少对昂贵的人工标注的依赖,并实现多语言评估。另一个框架,“动态元指标”(DMM),根据源句子属性动态组合现有指标,以提高机器翻译质量评估。 AI
影响 这些新颖的评估技术可以加速更准确、更可靠的NLP和MT系统的开发和部署。
排序理由 该集群包含两篇学术论文,详细介绍了NLP和MT评估的新研究方法。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →