研究人员推出了NRITYAM,这是一个旨在评估语言模型在特定全球舞蹈传统领域内文化理解力的新基准。该基准包含12种语言的9,260个问答对,是同类数据集中规模最大的。NRITYAM与舞蹈艺术家和母语人士合作开发,旨在为评估AI系统如何理解和推理传统表演艺术树立新标准。 AI
影响 该基准有望催生更具文化意识的AI系统,从而提高其在各种全球背景下的性能。
排序理由 该集群描述了一篇介绍用于评估语言模型基准数据集的新学术论文。
- alphaXiv
- arXiv
- CatalyzeX
- CORE Recommender
- DagsHub
- dance
- Gotit.pub
- Hugging Face
- Language Models
- ScienceCast
- large language models
- multimodal large language models
- small language models
- small multimodal language models
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →