一篇新发表在arXiv上的研究论文分析了11个大语言模型的地缘政治偏见,重点关注中美紧张关系。该研究开发了一种新颖的定量工具,通过改编调查心理测量技术来衡量模型的立场。该方法包括提出命题及其反向命题以消除简单的顺从性,从而分离出真实的信念。研究结果表明,开发者来源、查询语言和议题领域是影响偏见的重要因素,所有模型,包括美国开发的模型,在用中文查询时都表现出亲华倾向。 AI
影响 这项研究提供了一种新颖、可复现的方法来量化大语言模型的地缘政治偏见,可能影响未来的模型开发和评估标准。
排序理由 该集群包含一篇发表在arXiv上的学术论文,详细介绍了一种分析大语言模型偏见的新方法。 [lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- CatalyzeX
- DagsHub
- Gotit.pub
- Hugging Face
- ScienceCast
- Standard Chinese
- United States
- William Gueydan de Roussel
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →