PulseAugur
实时 09:17:19
English(EN) ChemQuests: A Curated Chemistry Question-Answer Database Extracted from ChemRxiv papers

新数据集通过 GPT-4o 生成的问答助力化学 NLP

研究人员开发了 ChemQuests,一个包含从 ChemRxiv 化学论文中提取的 952 个问答对的新数据集。该数据集使用了一个涉及 OCR、用于问答生成的 GPT-4o 和模糊搜索验证的流程创建,旨在支持化学领域的自然语言处理。ChemQuests 适用于检索式问答系统、搜索引擎开发以及针对化学领域的大型语言模型微调等应用。 AI

影响 提供了一个专业数据集,以提高 AI 对化学知识的理解和应用。

排序理由 该集群包含一篇详细介绍为化学领域 NLP 任务创建专业数据集的新学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Mahmoud Amiri, Thomas Bocklitz ·

    ChemQuests:从 ChemRxiv 论文中提取的精选化学问答数据库

    arXiv:2505.05232v3 Announce Type: replace Abstract: The rapid expansion of chemistry literature poses significant challenges for researchers seeking to efficiently access domain-specific knowledge. To support advancements in chemistry-focused natural language processing (NLP), we…