English(EN) xGR: Efficient Generative Recommendation Serving at Scale

新的xGR系统提高了生成式推荐服务的效率

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

研究人员开发了xGR，一个旨在提高生成式推荐（GR）服务效率和速度的新系统。GR系统利用大型语言模型（LLMs）通过分析用户-物品交互的长序列来增强用户推荐。提出的xGR系统通过优化预填充和解码阶段，解决了GR独特的计算需求，这些需求与标准的LLM服务不同。它引入了提前排序终止、基于掩码的物品过滤和多级并行等技术，以实现更低的延迟和更高的吞吐量，实验证明其性能比现有方法提高了2.89倍。 AI

影响优化了推荐系统的LLM服务，可能带来更快、更个性化的用户体验。

排序理由该集群包含一篇详细介绍生成式推荐服务新系统的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Qingxiao Sun, Tongxuan Liu, Shen Zhang, Siyu Wu, Peijun Yang, Haotian Liang, Menxin Li, Xiaolong Ma, Zhiwei Liang, Ziyi Ren, Minchao Zhang, Yifan Wang, Xinyu Liu, Ke Zhang, Hailong Yang, Depei Qian · 2026-06-30 04:00

xGR: Efficient Generative Recommendation Serving at Scale

arXiv:2512.11529v3 Announce Type: replace Abstract: Recommendation system delivers substantial economic benefits by providing personalized predictions. Generative recommendation (GR) integrates LLMs to enhance the understanding of long user-item sequences. Despite employing atten…

报道来源 [1]

xGR: Efficient Generative Recommendation Serving at Scale

相关实体

相关话题