English(EN) Field Order Should Not Matter: Permutation-Invariant Embedding Model Fine-Tuning for Structured Metadata Retrieval

新的PI-FT方法通过忽略字段顺序来改进结构化元数据检索

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-29 15:33

研究人员开发了一种名为置换不变微调（PI-FT）的新微调方法，以提高结构化元数据的检索准确性。标准的微调方法对元数据记录中字段的顺序敏感，当顺序改变时会导致检索质量显著下降。PI-FT通过在训练期间随机化字段顺序来解决这个问题，确保模型学会将含义与字段标签而不是其位置相关联。这种方法在保持分布内准确性的同时，极大地降低了与顺序变化相关的惩罚。该方法在DevDataBench基准上进行了测试，DevDataBench是一个用于发现开发统计信息的大型、由LLM生成的***，一个微调的118M参数模型在包括text-embedding-3-large模型在内的强基线之上表现出色。 AI

影响增强了AI代理对结构化数据的可发现性，改进了统计数据的接地和传播。

排序理由该项目是一篇学术论文，详细介绍了一种用于结构化元数据检索的嵌入模型微调新方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Aivin V. Solatorio, Olivier Dupriez, Rafael Macalaba · 2026-06-30 04:00

Field Order Should Not Matter: Permutation-Invariant Embedding Model Fine-Tuning for Structured Metadata Retrieval

arXiv:2606.30473v1 Announce Type: cross Abstract: We study retrieval over catalogs of structured metadata, where each record is a small schema whose fields answer different kinds of query. Embedding a record with a text encoder first serializes its fields into a string, which for…
arXiv cs.IR (Information Retrieval) TIER_1 English(EN) · Rafael Macalaba · 2026-06-29 15:33

Field Order Should Not Matter: Permutation-Invariant Embedding Model Fine-Tuning for Structured Metadata Retrieval

We study retrieval over catalogs of structured metadata, where each record is a small schema whose fields answer different kinds of query. Embedding a record with a text encoder first serializes its fields into a string, which forces a choice of field order. We show this choice, …

报道来源 [2]

Field Order Should Not Matter: Permutation-Invariant Embedding Model Fine-Tuning for Structured Metadata Retrieval

Field Order Should Not Matter: Permutation-Invariant Embedding Model Fine-Tuning for Structured Metadata Retrieval

相关实体

相关话题