研究人员开发了一个名为RobotValues的新基准,用于评估家用机器人在人类价值观发生冲突的情况下如何处理。该基准包含10,000个包含逼真家庭图像的场景,每个场景都呈现了多种机器人行为,这些行为优先考虑不同的价值观,如自主性、效率或社交适宜性。使用该基准进行的评估显示,当前的视觉语言模型表现出默认偏好,通常优先考虑安全性和便利性,而忽视隐私。此外,当被指示优先考虑冲突价值观时,这些模型经常无法覆盖其默认行为,80%的情况下会做出错误的选择。 AI
影响 凸显了AI系统在现实应用中更好地处理复杂伦理决策和价值观冲突的必要性。
排序理由 该集群描述了一篇介绍AI系统评估基准的新学术论文。
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →