PulseAugur
实时 07:39:43
English(EN) PETRA: Transforming Web Text for Petroleum-Engineering Domain Adaptation

PETRA数据集通过精选网络文本增强石油工程搜索 · 跟踪2个来源

研究人员开发了PETRA,这是一个新颖的数据集和管道,旨在改善石油工程领域的信息检索。该系统通过将嘈杂的公共网络文本转化为具有合成监督的精选语料库,用于密集检索和重排序,从而解决了领域特定相关性标签稀缺的问题。PETRA的构建包括高召回率的能源领域精选、准确的能源领域分类器、查询生成以及LLM编写的硬负例,从而显著提高了检索准确性和推理密集型任务的性能。 AI

影响 这项研究可能导致更专业技术领域中更有效的信息检索系统,改善工程师对关键数据的访问。

排序理由 该集群包含一篇详细介绍用于信息检索领域自适应的新数据集和管道的研究论文。

在 arXiv cs.IR (Information Retrieval) 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

PETRA数据集通过精选网络文本增强石油工程搜索 · 跟踪2个来源

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Kirill Dubovikov (Mohamed bin Zayed University of Artificial Intelligence), Omar El Mansouri (Mohamed bin Zayed University of Artificial Intelligence), Hachem Madmoun (Mohamed bin Zayed University of Artificial Intelligence), Yanda Li (Mohamed bin Zayed … ·

    PETRA:将网络文本应用于石油工程领域自适应

    arXiv:2606.24346v1 Announce Type: cross Abstract: Petroleum-engineering search exposes a supervision gap for strong general retrievers: relevant evidence exists in public web text, but domain relevance labels are scarce. To address this gap, we propose PETRA, a large-scale Petrol…

  2. arXiv cs.IR (Information Retrieval) TIER_1 English(EN) · Salem Lahlou ·

    PETRA:为石油工程领域自适应改造网络文本

    Petroleum-engineering search exposes a supervision gap for strong general retrievers: relevant evidence exists in public web text, but domain relevance labels are scarce. To address this gap, we propose PETRA, a large-scale Petroleum Engineering Text for Retrieval Adaptation data…