English(EN) Rethinking Molecular Text Representations for LLMs: An Empirical Study

研究发现大语言模型（LLM）的分子任务依赖于表示

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-03 04:00

一项新的arXiv研究对16个大语言模型在九种分子表示和八种化学任务上的性能进行了基准测试。研究发现，模型的性能在很大程度上取决于所使用的分子表示，其中CML和MolJSON等显式结构化文本格式在结构任务上表现出色，而IUPAC在语义任务上表现最佳。专门从事化学的模型在使用SMILES时表现强劲，但在结构化格式方面遇到困难，这表明其评估可能存在偏见。 AI

影响强调了在化学应用中，大语言模型（LLM）对特定任务的分子表示的至关重要性。

排序理由该集群包含一篇学术论文，详细介绍了关于大语言模型（LLM）在不同分子表示下的性能的实证研究。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Arun Raja, Garrett M. Morris, Kian Ming A. Chai · 2026-06-03 04:00

重新思考大语言模型（LLMs）的分子文本表示：一项实证研究

arXiv:2606.03057v1 Announce Type: cross Abstract: Large language models (LLMs) are increasingly used for molecular tasks, but it remains unclear which molecular representation to use. We present a systematic benchmark evaluating LLM molecular competence across nine representation…

报道来源 [1]

重新思考大语言模型（LLMs）的分子文本表示：一项实证研究

相关实体

相关话题