研究人员推出 OdysSim,一个用于开发旨在模拟人类行为的基础模型的新框架。该项目包括一个包含 2140 万次交互的大型语料库和一个名为 SOUL-Index 的基准测试,该基准测试统一了五个能力轴上的 23 项任务。由此产生的 80 亿参数模型 OSim 表现强劲,在 8 项任务上排名第一,并展示了类似人类的输出质量,甚至在零样本情况下也能泛化到分布外用户仿真。 AI
影响 这项研究可能会推动更逼真的人工智能模拟器在评估和社会仿真方面的开发,从而可能改善人机交互。
排序理由 该集群描述了一篇介绍用于模拟人类行为的新颖框架和模型的研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →