PulseAugur
实时 14:37:12
English(EN) Beyond Offline A/B Testing: Context-Aware Agent Simulation for Recommender System Evaluation

LLM代理模拟真实用户以评估推荐系统

研究人员开发了ContextSim,一个利用LLM代理模拟真实用户行为以评估推荐系统的新框架。与之前孤立地建模用户的方法不同,ContextSim整合了时间、地点和用户需求等上下文因素,以创建更可信的代理。该框架模拟代理的内部思考,并确保其行为和决策过程的一致性,从而使交互更接近人类行为,并提高使用此方法优化推荐系统时的真实世界参与度。 AI

影响 通过模拟更真实的用户交互来增强推荐系统评估,可能带来更量身定制的推荐。

排序理由 学术论文,详细介绍了一种评估推荐系统的新方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Nicolas Bougie, Gian Maria Marconi, Xiaotong Ye, Narimasa Watanabe ·

    Beyond Offline A/B Testing: Context-Aware Agent Simulation for Recommender System Evaluation

    arXiv:2604.09549v2 Announce Type: replace-cross Abstract: Recommender systems are central to online services, enabling users to navigate through massive amounts of content across various domains. However, their evaluation remains challenging due to the disconnect between offline …