PulseAugur
实时 01:53:19
English(EN) CFDLLMBench: A Benchmark Suite for Evaluating Large Language Models in Computational Fluid Dynamics

新的基准套件评估大语言模型在复杂计算流体动力学任务上的能力

研究人员开发了CFDLLMBench,一个旨在评估大语言模型在计算流体动力学(CFD)领域能力的新基准套件。该基准包含三个部分:用于知识评估的CFDQuery,用于数值和物理推理的CFDCodeBench,以及用于工作流实现的FoamBench。该套件旨在提供一种严谨且可复现的方法来量化大语言模型在自动化复杂科学实验方面的性能。 AI

影响 为大语言模型在科学模拟领域建立了标准化的评估框架,有望加速人工智能在计算科学中的应用。

排序理由 学术论文,介绍了一个用于评估大语言模型在科学领域的新基准套件。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的基准套件评估大语言模型在复杂计算流体动力学任务上的能力

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Nithin Somasekharan, Ling Yue, Yadi Cao, Weichao Li, Patrick Emami, Pochinapeddi Sai Bhargav, Anurag Acharya, Xingyu Xie, Shaowu Pan ·

    CFDLLMBench: A Benchmark Suite for Evaluating Large Language Models in Computational Fluid Dynamics

    arXiv:2509.20374v3 Announce Type: replace Abstract: Large Language Models (LLMs) have demonstrated strong performance across general NLP tasks, but their utility in automating numerical experiments of complex physical system -- a critical and labor-intensive component -- remains …