PulseAugur
实时 05:08:01
English(EN) Teaching LLMs Brazilian Healthcare: Injecting Knowledge from Official Clinical Guidelines

研究人员通过合成数据和强化学习调整大语言模型以适应巴西医疗保健

研究人员开发了一种方法,通过注入官方临床指南的知识来调整大语言模型以适应巴西医疗保健领域。他们从178项指南中创建了一个超过7000万个token的合成数据集,并对一个140亿参数的模型Qwen2.5-14B-Instruct进行了微调。这个调整后的模型在新基准HealthBench-BR和PCDT-QA上取得了高分,尽管模型规模较小,但表现优于几个领先的商业模型。该团队已发布数据集、基准和模型权重,以促进巴西葡萄牙语临床自然语言处理的进一步研究。 AI

影响 这项工作可以提高大语言模型在特定非英语临床领域的准确性和相关性,从而可能帮助巴西的医疗保健专业人员。

排序理由 这是一篇研究论文,详细介绍了为巴西葡萄牙语临床自然语言处理创建新数据集和基准,以及一个微调模型。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

研究人员通过合成数据和强化学习调整大语言模型以适应巴西医疗保健

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Hugo Abonizio, Filipe Rocha Lopes, Roberto Lotufo, Rodrigo Nogueira ·

    Teaching LLMs Brazilian Healthcare: Injecting Knowledge from Official Clinical Guidelines

    arXiv:2605.01077v1 Announce Type: new Abstract: Brazil's Unified Health System (SUS) relies on official clinical guidelines that define diagnostic criteria, treatments, dosages, and monitoring procedures for over 200 million citizens. Yet current LLMs perform poorly on this guide…