研究人员开发了一个新的框架,用于生成由知识图谱片段锚定的复杂问答数据集。该方法使用知识图谱中的小型子图来指导大型语言模型创建事实依据的问题。首个应用BioGraphletQA是一个生物医学数据集,包含超过119,000个问答对,在现有基准测试中已显示出准确性的显著提高。 AI
影响 提供了一种创建高质量问答数据集的可扩展方法,有可能提高LLM在专业知识领域的性能。
排序理由 介绍新数据集和复杂问答框架的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →