实体 HeadQA

HeadQA

PulseAugur coverage of HeadQA — every cluster mentioning HeadQA across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_93278 · Jun 16 · 04:00

大语言模型互相评判以提高医学问答准确性

研究人员开发了一种新颖的多智能体系统，其中大语言模型（LLMs）既充当问题解决者，又充当同行评审者，以提高医学问答的准确性。该方法涉及多个LLM智能体生成推理链，然后互相评估对方的逻辑的准确性和可靠性。使用五个LLM在三个基准数据集上进行的实验表明，这种同行评审推理方法始终优于单一模型推理和多数投票，最高准确率达到 0.820。