English(EN) FOUNDv2: Learning Unified User Quantized Tokenizers for User Representation

FOUNDv2 框架通过量化分词器增强用户表示

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-16 04:00

研究人员推出了一种新颖的用户表示学习框架 FOUNDv2，旨在解决传统连续嵌入方法的局限性。该新方案利用统一用户量化分词器 (U2QT) 将异构用户数据转换为标准化的离散分词空间，显著降低了存储和计算成本。FOUNDv2 采用两阶段架构进行特征提取和离散化，并结合多尺度对齐目标来捕捉细粒度行为和时间模式。在支付宝上的大规模部署证明了其在工业场景中的实际可扩展性和效率。 AI

影响这项研究提供了一种更高效的用户表示方法，有望改善个性化服务并降低大型平台的基础设施成本。

排序理由这是一篇详细介绍新框架及其实验结果的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Chuan He, Yang Chen, Bin Dou, Wuliang Huang, Baokun Wang, Yongchao Liu, Xing Fu, Yu Cheng, Chuntao Hong, Weiqiang Wang, Zhongle Xie, Jiajun Zheng, Xin-Wei Yao · 2026-06-16 04:00

FOUNDv2: Learning Unified User Quantized Tokenizers for User Representation

arXiv:2508.00956v3 Announce Type: replace-cross Abstract: User representation learning serves as a fundamental pillar for personalized services on large-scale web platforms. Despite its importance, conventional continuous embedding methods face significant challenges, including t…

报道来源 [1]

FOUNDv2: Learning Unified User Quantized Tokenizers for User Representation

相关实体

相关话题