PulseAugur
实时 10:02:56
实体 Pest-Thinker

Pest-Thinker

PulseAugur coverage of Pest-Thinker — every cluster mentioning Pest-Thinker across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_21818 ·

    Pest-Thinker 使用强化学习帮助 MLLMs 像昆虫学家一样推理

    研究人员开发了 Pest-Thinker,一个新颖的强化学习框架,旨在增强多模态大语言模型 (MLLMs) 在农业害虫识别方面的推理能力。该系统通过使 MLLMs 能够分析细粒度的害虫形态,解决了高物种间复杂性和有限专家数据等挑战。Pest-Thinker 利用带有合成思维链轨迹的监督微调和一种群体相对策略优化方法,并以 LLM-as-a-Judge 策略为指导,来提高对害虫的视觉理解能力。