PulseAugur
实时 13:43:39
实体 production engineering

production engineering

PulseAugur coverage of production engineering — every cluster mentioning production engineering across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_56074 ·

    新的PetroBench基准测试评估石油工程领域的大语言模型

    一项新的基准测试PetroBench已被开发出来,用于专门评估大语言模型(LLMs)在石油工程领域的性能。该基准测试包含1200个不同格式的问题,涵盖生产、储层和钻井工程,并用于评估八个主流大语言模型。评估显示,尽管模型在事实辨别方面存在困难,尤其是在储层工程领域,但表现最佳的模型如Gemini-3-Pro、Kimi-K2.5和Claude-Opus-4.6-Thinking的总体得分在72%到74%之间。研究还指出了中国模型和国际模…