PulseAugur
实时 07:23:07
English(EN) RobotValues: Evaluating Household Robots When Human Values Conflict

RobotValues基准测试凸显AI在处理冲突人类价值观方面的挣扎

研究人员开发了一个名为RobotValues的新基准,用于评估家用机器人在人类价值观发生冲突的情况下如何处理。该基准包含10,000个包含逼真家庭图像的场景,每个场景都呈现了多种机器人行为,这些行为优先考虑不同的价值观,如自主性、效率或社交适宜性。使用该基准进行的评估显示,当前的视觉语言模型表现出默认偏好,通常优先考虑安全性和便利性,而忽视隐私。此外,当被指示优先考虑冲突价值观时,这些模型经常无法覆盖其默认行为,80%的情况下会做出错误的选择。 AI

影响 凸显了AI系统在现实应用中更好地处理复杂伦理决策和价值观冲突的必要性。

排序理由 该集群描述了一篇介绍AI系统评估基准的新学术论文。

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Jongwook Han, Hyeongjin Kim, Yohan Jo ·

    RobotValues:评估人类价值观冲突时的家用机器人

    arXiv:2606.03312v1 Announce Type: cross Abstract: While household robots are often evaluated based on task completion, everyday domestic environments involve value-conflicting situations in which robots are expected to choose actions that prioritize other values than task success…

  2. Hugging Face Daily Papers TIER_1 English(EN) ·

    RobotValues:评估人类价值观冲突时的家用机器人

    RobotValues benchmark evaluates household robot planners in value-conflict scenarios, revealing that vision-language models exhibit default value preferences and struggle to override them when instructed to prioritize conflicting values.