English(EN) Reinforced Preference Optimization for Reasoning-Augmented Recommendations

新框架统一大型语言模型与推荐系统以实现更好的个性化

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-21 03:56

研究人员开发了RPORec，一个将大型语言模型（LLMs）与推荐系统相结合的新型框架。该方法使用思维链（Chain-of-Thought）推理来增强LLM对用户偏好和语义关系的理解，从而提供更准确、更具可解释性的推荐。该系统通过强化学习来优化LLM的推理，并由专门的推荐头生成的奖励来指导，在实验和实际部署中均证明了其优于现有基于LLM的方法的性能。 AI

影响增强LLM的推理能力以实现个性化内容推送，可能提高用户在数字平台上的参与度和发现能力。

排序理由发布了一篇详细介绍LLM增强推荐系统新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.IR (Information Retrieval) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.IR (Information Retrieval) TIER_1 English(EN) · Xiangyu Zhao · 2026-05-21 03:56

用于推理增强推荐的强化偏好优化

Recommender systems are critical for delivering personalized content across digital platforms, and recent advances in Large Language Models (LLMs) offer new opportunities to enhance them with richer world knowledge and explicit reasoning capabilities. With the help of reasoning k…

报道来源 [1]

用于推理增强推荐的强化偏好优化

相关实体

相关话题