实体 scBench-Long

scBench-Long

PulseAugur coverage of scBench-Long — every cluster mentioning scBench-Long across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_111694 · Jun 26 · 04:00

新基准 scBench-Long 测试 AI 从单细胞数据中得出科学结论的能力

研究人员推出了 scBench-Long，这是一个旨在评估 AI 代理从单细胞生物学数据中得出复杂科学结论的能力的新基准。该基准涵盖了癌症、发育和传染病等各种生物学背景下的 21 项评估，要求代理在没有规定方法的情况下整合元数据和辅助证据。目前的 AI 模型在这些长时程任务中表现不佳，表现最好的模型-工具组合在 1,068 条轨迹上的成功率仅为 25.4%。