研究人员开发了Geo-Strat-RL,这是一个旨在训练视觉语言模型(VLMs)推理地质事件历史的合成环境。该系统使用带有可验证奖励的强化学习(RLVR)来生成地层观测和相关的事件历史,然后由可执行验证器对其在年代顺序、事件身份、沉积和结构关系方面的准确性进行评分。研究表明,RLVR训练提高了VLMs的地质重建能力,从地层图中学到的推理能力可以迁移到合成地震表示上,而无需进行特定于地震的训练。 AI
影响 这项研究可能带来更强大的AI系统,使其能够在科学领域跨不同数据模态进行复杂推理。
排序理由 该集群包含一篇研究论文,详细介绍了一种用于训练AI模型进行地质推理的新方法。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →