PulseAugur
实时 23:01:21
实体 metagenomics

metagenomics

PulseAugur coverage of metagenomics — every cluster mentioning metagenomics across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_20585 ·

    新的基准测试评估 AI 代理执行复杂生物学研究的能力

    发布了两个新的基准套件 BioAgent Bench 和 LABBench2,分别用于评估人工智能在生物信息学和更广泛的生物学研究中的能力。这些基准测试评估了人工智能系统执行复杂、多步骤科学任务的能力,超越了简单的知识回忆,实现了现实世界的应用。虽然当前的前沿模型在完成这些任务方面显示出潜力,但它们在稳健性测试和难度增加的情况下性能会显著下降,突显了未来发展的方向。这些数据集和评估工具的发布旨在加速人工智能驱动的科学发现的进展。