PulseAugur
实时 03:38:00
English(EN) SciHorizon-GENE: Benchmarking LLM for Life Sciences Inference from Gene Knowledge to Functional Understanding

新基准测试 LLM 的基因层面生物推理能力

研究人员推出了 SciHorizon-GENE,这是一个旨在评估大型语言模型 (LLM) 在理解和推理基因层面生物信息方面的能力的新基准。该基准源自广泛的生物数据库,包含超过 540,000 个问题,涵盖与细胞注释和机制分析相关的基因到功能推理。对当前 LLM 的评估显示,它们在基因层面推理能力方面存在显著差异,并且在生成准确完整的功能解释方面仍然存在问题。 AI

影响 为评估 LLM 在生命科学领域的性能树立了新标准,指导生物解释任务的开发。

排序理由 该集群包含一篇学术论文,介绍了一个用于评估 LLM 在特定科学领域的新基准。 [lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Xiaohan Huang, Meng Xiao, Chuan Qin, Qingqing Long, Jinmiao Chen, Yuanchun Zhou, Hengshu Zhu ·

    SciHorizon-GENE: Benchmarking LLM for Life Sciences Inference from Gene Knowledge to Functional Understanding

    arXiv:2601.12805v3 Announce Type: replace-cross Abstract: Large language models (LLMs) have shown growing promise in biomedical research, particularly for knowledge-driven interpretation tasks. However, their ability to reliably reason from gene-level knowledge to functional unde…