PulseAugur
实时 22:19:38

新算法使用对话式查询进行个性化多目标老虎机

研究人员开发了一种新算法 MO-PQUCB,旨在改进多目标老虎机问题中的个性化决策。该算法独特地利用用户的主动对话式查询,例如“便宜又干净”选项的请求,以更好地理解他们的偏好。通过将这些结构化的偏好信号与传统的老虎机反馈相结合,MO-PQUCB 旨在加速偏好估计并减少与现有方法相比的遗憾,即使查询不完美。 AI

影响 通过将用户对话信号纳入老虎机算法来增强个性化决策。

排序理由 该集群包含一篇详细介绍多目标老虎机新算法的学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Linfeng Cao, Ming Shi, Ness B. Shroff ·

    可证明高效的个性化多目标老虎机与主动对话查询

    arXiv:2606.08410v1 Announce Type: cross Abstract: Personalized decision-making in multi-objective bandits requires learning user-specific trade-offs among competing objectives. Since arm utility depends on both unknown rewards and unknown preferences, existing methods infer prefe…

  2. arXiv cs.AI TIER_1 English(EN) · Ness B. Shroff ·

    可证明高效的个性化多目标老虎机与主动对话查询

    Personalized decision-making in multi-objective bandits requires learning user-specific trade-offs among competing objectives. Since arm utility depends on both unknown rewards and unknown preferences, existing methods infer preferences only from utility feedback, entangling pref…