OpenAI推出了LifeSciBench,这是一个旨在评估和增强人工智能在现实生命科学研究中能力的新基准。该基准由来自生物技术和制药行业的173名科学家合作开发,包含750项专家编写的任务。LifeSciBench旨在评估人工智能从证据推理、管理科学产物、处理不确定性以及做出实际决策的能力,超越狭隘的技能测试。 AI
影响 为生命科学领域的人工智能评估设定了新标准,有可能加速人工智能在该领域的采用和发展。
排序理由 前沿实验室产品发布,包含新的基准和初步模型性能数据。
AI 生成摘要 · Google Gemini · 来自 4 个来源。 我们如何撰写摘要 →