研究人员开发了一种由嵌入驱动的方法来改进概率种族预测,解决了现有方法(如贝叶斯改进姓氏地理编码 (BISG))的局限性。标准的 BISG 依赖于遗漏不常见姓氏的人口普查数据,导致对相当一部分人口的性能下降。新方法 eBISG 利用预训练的文本嵌入和神经网络来估计 Census 未覆盖姓氏的种族概率,显示出显著的收益,尤其是在西班牙裔和亚裔个体方面。 AI
影响 通过改进对代表性不足的姓氏的种族预测来增强人口统计分析,可能有助于差异研究。
排序理由 这是一篇研究论文,详细介绍了一种使用嵌入模型改进种族预测的新方法。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →