English(EN) SciHorizon-GENE: Benchmarking LLM for Life Sciences Inference from Gene Knowledge to Functional Understanding

新基准测试 LLM 的基因层面生物推理能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-25 04:00

研究人员推出了 SciHorizon-GENE，这是一个旨在评估大型语言模型 (LLM) 在理解和推理基因层面生物信息方面的能力的新基准。该基准源自广泛的生物数据库，包含超过 540,000 个问题，涵盖与细胞注释和机制分析相关的基因到功能推理。对当前 LLM 的评估显示，它们在基因层面推理能力方面存在显著差异，并且在生成准确完整的功能解释方面仍然存在问题。 AI

影响为评估 LLM 在生命科学领域的性能树立了新标准，指导生物解释任务的开发。

排序理由该集群包含一篇学术论文，介绍了一个用于评估 LLM 在特定科学领域的新基准。 [lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Xiaohan Huang, Meng Xiao, Chuan Qin, Qingqing Long, Jinmiao Chen, Yuanchun Zhou, Hengshu Zhu · 2026-05-25 04:00

SciHorizon-GENE：为生命科学从基因知识到功能理解的推理基准测试大语言模型

arXiv:2601.12805v3 Announce Type: replace-cross Abstract: Large language models (LLMs) have shown growing promise in biomedical research, particularly for knowledge-driven interpretation tasks. However, their ability to reliably reason from gene-level knowledge to functional unde…

报道来源 [1]

SciHorizon-GENE：为生命科学从基因知识到功能理解的推理基准测试大语言模型

相关实体

相关话题