PulseAugur
实时 08:58:53
实体 RobotValues

RobotValues

PulseAugur coverage of RobotValues — every cluster mentioning RobotValues across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_68351 ·

    RobotValues基准测试凸显AI在处理冲突人类价值观方面的挣扎

    研究人员开发了一个名为RobotValues的新基准,用于评估家用机器人在人类价值观发生冲突的情况下如何处理。该基准包含10,000个包含逼真家庭图像的场景,每个场景都呈现了多种机器人行为,这些行为优先考虑不同的价值观,如自主性、效率或社交适宜性。使用该基准进行的评估显示,当前的视觉语言模型表现出默认偏好,通常优先考虑安全性和便利性,而忽视隐私。此外,当被指示优先考虑冲突价值观时,这些模型经常无法覆盖其默认行为,80%的情况下会做出错误的选择。