研究人员推出了 SciHorizon-GENE,这是一个旨在评估大型语言模型 (LLM) 在理解和推理基因层面生物信息方面的能力的新基准。该基准源自广泛的生物数据库,包含超过 540,000 个问题,涵盖与细胞注释和机制分析相关的基因到功能推理。对当前 LLM 的评估显示,它们在基因层面推理能力方面存在显著差异,并且在生成准确完整的功能解释方面仍然存在问题。 AI
影响 为评估 LLM 在生命科学领域的性能树立了新标准,指导生物解释任务的开发。
排序理由 该集群包含一篇学术论文,介绍了一个用于评估 LLM 在特定科学领域的新基准。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →