实体 TOMG-Bench MOLOPT

TOMG-Bench MOLOPT

PulseAugur coverage of TOMG-Bench MOLOPT — every cluster mentioning TOMG-Bench MOLOPT across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 1

发布 · 30天

90 天内 0

论文 · 30天

90 天内 1

层级分布 · 90 天

主题

论文 1
模型发布 1

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_121090 · Jul 1 · 07:22

新的Active-GRPO方法增强了LLM在分子优化中的推理能力

研究人员推出了一种名为Active-GRPO的新方法，旨在增强大型语言模型在科学任务（特别是分子优化）中的推理能力。该方法通过结合自适应模仿和自改进策略，解决了现有监督微调和强化学习等训练技术的局限性。Active-GRPO动态决定是遵循现有参考还是通过强化学习进行自我发现，并持续升级自身的模仿目标以提高性能。

新的Active-GRPO方法增强了LLM在分子优化中的推理能力