English(EN) RobotValues: Evaluating Household Robots When Human Values Conflict

RobotValues基准测试凸显AI在处理冲突人类价值观方面的挣扎

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-02 00:00

研究人员开发了一个名为RobotValues的新基准，用于评估家用机器人在人类价值观发生冲突的情况下如何处理。该基准包含10,000个包含逼真家庭图像的场景，每个场景都呈现了多种机器人行为，这些行为优先考虑不同的价值观，如自主性、效率或社交适宜性。使用该基准进行的评估显示，当前的视觉语言模型表现出默认偏好，通常优先考虑安全性和便利性，而忽视隐私。此外，当被指示优先考虑冲突价值观时，这些模型经常无法覆盖其默认行为，80%的情况下会做出错误的选择。 AI

影响凸显了AI系统在现实应用中更好地处理复杂伦理决策和价值观冲突的必要性。

排序理由该集群描述了一篇介绍AI系统评估基准的新学术论文。

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Jongwook Han, Hyeongjin Kim, Yohan Jo · 2026-06-03 04:00

RobotValues：评估人类价值观冲突时的家用机器人

arXiv:2606.03312v1 Announce Type: cross Abstract: While household robots are often evaluated based on task completion, everyday domestic environments involve value-conflicting situations in which robots are expected to choose actions that prioritize other values than task success…
Hugging Face Daily Papers TIER_1 English(EN) · 2026-06-02 00:00

RobotValues：评估人类价值观冲突时的家用机器人

RobotValues benchmark evaluates household robot planners in value-conflict scenarios, revealing that vision-language models exhibit default value preferences and struggle to override them when instructed to prioritize conflicting values.

报道来源 [2]

RobotValues：评估人类价值观冲突时的家用机器人

RobotValues：评估人类价值观冲突时的家用机器人

相关实体

相关话题