English(EN) P3B3: A Multi-Turn Conversational Benchmark for Measuring European and Brazilian Portuguese Variety Bias in LLMs

新基准揭示大型语言模型对巴西葡萄牙语存在偏见

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-15 14:10

一个名为 P3B3 的新基准已被开发出来，用于评估大型语言模型（LLMs）如何处理葡萄牙语的变体，特别是欧洲葡萄牙语（pt-PT）和巴西葡萄牙语（pt-BR）。该基准旨在解决当前 pt-BR 数据更普遍存在的不平衡问题，导致大型语言模型（LLMs）表现出对该变体的偏见。使用 P3B3 进行的实验显示，大多数经过测试的大型语言模型（LLMs）都强烈偏好 pt-BR，不同模型之间的可控性程度各不相同，这突显了在大型语言模型（LLMs）中更均衡地表示语言变体的必要性。 AI

影响强调了在大型语言模型（LLMs）中改善语言多样性表示的必要性，以确保在不同语言变体上实现公平可靠的性能。

排序理由该集群描述了一篇介绍大型语言模型（LLM）研究基准的新学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Rafael Ferreira, In\^es Vieira, In\^es Calvo, James Furtado, Iago Paulo, Diogo Tavares, Diogo Gl\'oria-Silva, David Semedo, Jo\~ao Magalh\~aes · 2026-06-16 04:00

P3B3: A Multi-Turn Conversational Benchmark for Measuring European and Brazilian Portuguese Variety Bias in LLMs

arXiv:2606.16753v1 Announce Type: cross Abstract: As Large Language Models (LLMs) become embedded in everyday communication, capturing regional linguistic variation is essential for reliable and equitable language use. In Portuguese, European (pt-PT) and Brazilian (pt-BR) varieti…
arXiv cs.AI TIER_1 English(EN) · João Magalhães · 2026-06-15 14:10

P3B3: A Multi-Turn Conversational Benchmark for Measuring European and Brazilian Portuguese Variety Bias in LLMs

As Large Language Models (LLMs) become embedded in everyday communication, capturing regional linguistic variation is essential for reliable and equitable language use. In Portuguese, European (pt-PT) and Brazilian (pt-BR) varieties remain unevenly represented, with pt-BR dominat…

报道来源 [2]

P3B3: A Multi-Turn Conversational Benchmark for Measuring European and Brazilian Portuguese Variety Bias in LLMs

P3B3: A Multi-Turn Conversational Benchmark for Measuring European and Brazilian Portuguese Variety Bias in LLMs

相关实体

相关话题