PulseAugur
实时 12:46:25
English(EN) DrugClaw and DrugAudit: A Primary-Source-Grounded Agent and Authority-Aware Benchmark for Drug-Information Question Answering

新的基准测试和代理系统改进药物信息问答

研究人员开发了 DrugClaw,这是一个多代理系统,旨在实现准确的药物信息问答。该系统利用驱动式工作流程查询药物注册表,并提供基于一手监管或同行评审记录的答案。为了评估其性能,他们还创建了 DrugAudit,一个包含 3,772 个项目的基准测试,用于评估来源匹配、片段重叠和引文忠实度。DrugClaw 在 DrugAudit 和相关的医学问答数据集上的所有指标上均表现出卓越的性能。 AI

影响 提高了药物信息检索的准确性和可信度,这对于临床决策和监管合规至关重要。

排序理由 该集群描述了一篇介绍特定领域(药物信息问答)新基准测试和相应代理系统的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Qing Wang, Bo Li, Jialu Liang, Daling Shi, Bob Zhang, Qianqian Song ·

    DrugClaw and DrugAudit: A Primary-Source-Grounded Agent and Authority-Aware Benchmark for Drug-Information Question Answering

    arXiv:2606.01434v1 Announce Type: new Abstract: Drug-information question answering is a high-stakes setting where hallucinated facts can mislead clinical decision-making and the provenance of each cited fact matters as much as the fact itself. We present DrugClaw, a multi-agent …