PulseAugur
实时 15:11:00
English(EN) What Limits Does Quantization Place on Dense Top-$k$ Retrieval? A Theoretical Study

研究发现量化限制了密集检索的维度

arXiv上发表的一项新的理论研究探讨了量化对密集 top-k 检索系统施加的限制。研究表明,使用每个坐标 B 比特实现完美检索需要嵌入维度随着语料库大小(N)的对数增长,这与先前在无限精度下假设的语料库独立性相矛盾。研究结果表明,随着数据语料库的扩展,实际的向量数据库和检索系统必须增加嵌入维度,并可能增加精度。 AI

影响 强调实际向量数据库由于量化限制需要随语料库大小扩展嵌入维度。

排序理由 该集群包含一项在 arXiv 上发表的理论研究,涉及密集检索系统中量化的限制。

在 arXiv cs.IR (Information Retrieval) 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Koki Okajima, Tsukasa Yoshida ·

    What Limits Does Quantization Place on Dense Top-$k$ Retrieval? A Theoretical Study

    arXiv:2606.11780v1 Announce Type: cross Abstract: We establish conditions for embedding a corpus of $N$ documents as $d$-dimensional vectors such that every $k$-subset $S \subseteq [N]$ is realizable as a result of top-$k$ retrieval by some query vector. Recent work shows that $d…

  2. arXiv cs.IR (Information Retrieval) TIER_1 English(EN) · Tsukasa Yoshida ·

    量化对密集 Top-k 检索的限制有多大?一项理论研究

    We establish conditions for embedding a corpus of $N$ documents as $d$-dimensional vectors such that every $k$-subset $S \subseteq [N]$ is realizable as a result of top-$k$ retrieval by some query vector. Recent work shows that $d = O(k)$ suffices for such embeddings to exist in …