研究人员开发了CFDLLMBench,一个旨在评估大语言模型在计算流体动力学(CFD)领域能力的新基准套件。该基准包含三个部分:用于知识评估的CFDQuery,用于数值和物理推理的CFDCodeBench,以及用于工作流实现的FoamBench。该套件旨在提供一种严谨且可复现的方法来量化大语言模型在自动化复杂科学实验方面的性能。 AI
影响 为大语言模型在科学模拟领域建立了标准化的评估框架,有望加速人工智能在计算科学中的应用。
排序理由 学术论文,介绍了一个用于评估大语言模型在科学领域的新基准套件。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →