研究人员推出了 AmchiBias,这是一个旨在衡量果阿身份群体内刻板印象偏见的新型基准,使用了英语和孔卡尼语的最小对数据集。该基准评估了五个多语言编码器模型,结果显示,虽然模型在用英语查询时对泛印度群体表现出高度偏见,但在孔卡尼语中的表现接近随机,表明其对超本地身份缺乏语言和文化能力。这项工作突显了低资源多语言自然语言处理评估在特定社区身份方面存在的重大差距。 AI
影响 突显了低资源多语言自然语言处理评估在超本地社区身份方面存在的关键差距。
排序理由 学术论文发布在 arXiv 上,详细介绍了用于自然语言处理偏见的新基准。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →