PulseAugur
实时 14:48:34
English(EN) OdysSim: Building Foundation Models for Human Behavior Simulation

新的基础模型旨在大规模模拟人类行为

研究人员推出 OdysSim,一个用于开发旨在模拟人类行为的基础模型的新框架。该项目包括一个包含 2140 万次交互的大型语料库和一个名为 SOUL-Index 的基准测试,该基准测试统一了五个能力轴上的 23 项任务。由此产生的 80 亿参数模型 OSim 表现强劲,在 8 项任务上排名第一,并展示了类似人类的输出质量,甚至在零样本情况下也能泛化到分布外用户仿真。 AI

影响 这项研究可能会推动更逼真的人工智能模拟器在评估和社会仿真方面的开发,从而可能改善人机交互。

排序理由 该集群描述了一篇介绍用于模拟人类行为的新颖框架和模型的研究论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新的基础模型旨在大规模模拟人类行为

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Xuhui Zhou, Weiwei Sun, Weihua Du, Jiarui Liu, Haojia Sun, Qianou Ma, Tongshuang Wu, Yiming Yang, Maarten Sap ·

    OdysSim:构建用于人类行为模拟的基础模型

    arXiv:2606.14199v1 Announce Type: cross Abstract: Large language models are increasingly deployed as human simulators for interactive evaluation and social simulation. Yet helpfulness-driven post-training pulls them toward a homogeneous, overly agreeable assistant register, creat…

  2. arXiv cs.AI TIER_1 English(EN) · Maarten Sap ·

    OdysSim:构建用于人类行为模拟的基础模型

    Large language models are increasingly deployed as human simulators for interactive evaluation and social simulation. Yet helpfulness-driven post-training pulls them toward a homogeneous, overly agreeable assistant register, creating a behavioral Sim2Real gap. We present OdysSim,…