实体
AI4Science
AI4Science
PulseAugur coverage of AI4Science — every cluster mentioning AI4Science across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新基准PolyBench增强LLM在聚合物设计方面的能力
研究人员开发了PolyBench,这是一个全面的基准数据集和训练方法,用于专注于聚合物设计任务的大型语言模型(LLM)。该数据集包含超过125,000个任务,并利用了数百万个数据点的知识库,旨在为LLM提供聚合物科学所需的特定知识和推理能力。实验表明,使用PolyBench的知识增强推理蒸馏方法训练的较小语言模型,在聚合物相关挑战方面可以超越同等大小的模型,并与更大、闭源的LLM竞争,这预示着AI在科学发现方面取得进展的希望。
-
新基准SciPaths测试AI预测科学发现路径的能力
研究人员推出了SciPaths,这是一个旨在通过识别赋能性贡献及其对先前工作的依赖性来预测科学发现路径的新基准。与专注于引文预测等更简单任务的现有基准不同,SciPaths要求模型从目标贡献向后推理到必要的构建块。对当前前沿和开源语言模型的评估表明,即使是最好的模型也难以进行这种复杂的推理,F1分数仅为0.189,表明准确恢复方法论依赖性仍然是一个重大挑战。