PulseAugur
实时 09:10:51

新研究发现大型语言模型在分子泛化方面存在困难

一项新的研究论文质疑了大型语言模型(LLMs)在分子领域的泛化能力。该研究引入了一个“分子扰动”框架,以测试大型语言模型对分子结构变化的反应。研究结果表明,即使是微小的结构变化也会显著降低大型语言模型在分子任务上的表现,突显了其信任区域的局限性。研究认为,上下文学习(In-Context Tuning, ICT)可能通过提高对这类结构变化的鲁棒性来提供部分解决方案。 AI

影响 这项研究表明,目前的大型语言模型可能无法在分子发现任务中表现出足够的鲁棒性,可能需要新的方法才能在化学领域可靠应用。

排序理由 该集群包含一篇分析大型语言模型在特定领域泛化能力的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新研究发现大型语言模型在分子泛化方面存在困难

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Jiatong Li, Weida Wang, Changmeng Zheng, Shufei Zhang, Yatao Bian, Xiao-yong Wei, Qing Li ·

    Do LLMs Truly Generalize in the Molecular Domain? A Perturbation-Based Analysis

    arXiv:2607.01800v1 Announce Type: cross Abstract: Large Language Models (LLMs) have recently shown promise in molecular discovery, yet a gap remains between their probabilistic nature over discrete sequential tokens and the rigid topological constraints of chemical space. This ra…

  2. arXiv cs.CL TIER_1 English(EN) · Qing Li ·

    Do LLMs Truly Generalize in the Molecular Domain? A Perturbation-Based Analysis

    Large Language Models (LLMs) have recently shown promise in molecular discovery, yet a gap remains between their probabilistic nature over discrete sequential tokens and the rigid topological constraints of chemical space. This raises the question of whether molecular LLMs can ge…