研究人员推出 HomeFlow,一个旨在改进智能家居环境中 AI 代理训练的新型数据飞轮。该系统利用统一的模拟环境和家庭场景的程序化生成,来创建多样化且可验证的训练数据。HomeFlow 合成多轮轨迹,并通过微调和强化学习优化代理,在新基准上实现了高任务成功率,甚至超越了 GPT-5.5。 AI
影响 这项研究可能会加速开发更强大的 AI 代理,用于控制智能家居设备和其他现实世界应用。
排序理由 该集群包含一篇详细介绍 AI 代理训练新方法的 ist 研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →