研究人员开发了 ChemQuests,一个包含从 ChemRxiv 化学论文中提取的 952 个问答对的新数据集。该数据集使用了一个涉及 OCR、用于问答生成的 GPT-4o 和模糊搜索验证的流程创建,旨在支持化学领域的自然语言处理。ChemQuests 适用于检索式问答系统、搜索引擎开发以及针对化学领域的大型语言模型微调等应用。 AI
影响 提供了一个专业数据集,以提高 AI 对化学知识的理解和应用。
排序理由 该集群包含一篇详细介绍为化学领域 NLP 任务创建专业数据集的新学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →