English(EN) Beyond Retrieval: A Multitask Benchmark and Model for Code Search

新的CoREB基准和模型提升代码搜索能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-06 08:05

研究人员推出了CoREB，一个旨在超越简单检索以改进代码搜索的新基准和模型。CoREB通过关注包含重排序和开发者风格查询的完整代码搜索流程，解决了现有基准的局限性，例如数据污染和噪声标签。对各种嵌入模型和重排序器的实验表明，虽然代码专业化嵌入在代码到代码检索方面表现出色，但没有单一模型在所有任务上都表现最佳，并且短关键词查询会显著降低性能。提出的CoREB-Reranker在所有评估的任务中均显示出持续的收益，并且该基准数据和模型已发布。 AI

影响通过提供更全面的基准和专门的重排序模型来增强代码搜索能力。

排序理由该集群描述了一篇介绍代码搜索基准和模型的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Hugging Face Daily Papers TIER_1 English(EN) · 2026-05-06 08:05

Beyond Retrieval: A Multitask Benchmark and Model for Code Search

Code search has usually been evaluated as first-stage retrieval, even though production systems rely on broader pipelines with reranking and developer-style queries. Existing benchmarks also suffer from data contamination, label noise, and degenerate binary relevance. In this pap…

报道来源 [1]

Beyond Retrieval: A Multitask Benchmark and Model for Code Search

相关实体

相关话题