English(EN) AI’s Dirty Secret: It Mostly Speaks English

人工智能模型主要以英语训练，限制了全球覆盖范围

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-19 14:00

尽管声称具备多语言能力，但由于训练数据不平衡，大多数人工智能系统主要使用英语运行。大型语言模型主要在英语内容上进行训练，研究表明多达90%的训练词元是英语。这种语言偏见意味着人工智能在处理信息时，即使在翻译输出时，也常常通过以英语为中心的视角进行，可能会忽略文化细微差别和本地背景。因此，人工智能在非英语语言中的表现可能较弱，错误率较高，影响其在多样化全球应用中的有效性。 AI

影响人工智能系统的以英语为中心的训练限制了其在非英语语言中的有效性和文化细微差别，影响了全球应用。

排序理由文章讨论了人工智能训练数据偏见的含义，这是一篇分析性评论，而非新发布或事件。

在 Forbes — Innovation 阅读 →

其他

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Forbes — Innovation TIER_1 English(EN) · Véronique Özkaya, Forbes Councils Member · 2026-05-19 14:00

人工智能的肮脏秘密：它主要说英语

True multilingual intelligence requires models that are trained, evaluated and optimized across languages and cultures from the outset.

报道来源 [1]

人工智能的肮脏秘密：它主要说英语

相关实体

相关话题