PulseAugur
实时 07:39:46
English(EN) Bridging the Cold-Start Gap: LLM-Powered Synthetic Data Generation for Natural Language Search at Airbnb

Airbnb 使用 LLM 生成搜索合成数据

Airbnb 的研究人员开发了一个创新的框架,利用大型语言模型 (LLM) 为自然语言搜索系统生成合成数据。该方法通过创建真实的用戶查询和相关性标签来解决关键的冷启动问题,从而能够有效地进行模型训练和评估。与基线方法相比,该方法显著提高了查询的真实性和属性分布匹配度,为改进检索和排名模型提供了宝贵的信号。 AI

影响 为数据稀疏环境中的搜索系统训练和评估提供了一种可扩展的方法,有可能改善用户体验和搜索相关性。

排序理由 详细介绍使用 LLM 进行合成数据生成的创新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.IR (Information Retrieval) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.IR (Information Retrieval) TIER_1 English(EN) · Sanjeev Katariya ·

    Bridging the Cold-Start Gap: LLM-Powered Synthetic Data Generation for Natural Language Search at Airbnb

    Deploying natural language search systems presents a critical cold-start challenge: no real user queries to learn linguistic patterns, and no relevance labels to train ranking models. We present a framework for generating synthetic queries and labels using large language models (…