PulseAugur
实时 04:56:05
实体 scBench-Long

scBench-Long

PulseAugur coverage of scBench-Long — every cluster mentioning scBench-Long across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_111694 ·

    新基准 scBench-Long 测试 AI 从单细胞数据中得出科学结论的能力

    研究人员推出了 scBench-Long,这是一个旨在评估 AI 代理从单细胞生物学数据中得出复杂科学结论的能力的新基准。该基准涵盖了癌症、发育和传染病等各种生物学背景下的 21 项评估,要求代理在没有规定方法的情况下整合元数据和辅助证据。目前的 AI 模型在这些长时程任务中表现不佳,表现最好的模型-工具组合在 1,068 条轨迹上的成功率仅为 25.4%。