PulseAugur
实时 08:32:19
English(EN) Navigating Gigapixel Pathology Images with Large Multimodal Models

多模态模型利用 GIANT 导航吉比特级病理图像

研究人员开发了 GIANT,这是一种新颖的方法,使通用多模态模型能够在没有特定任务训练的情况下导航吉比特级病理图像。该方法允许模型在不同放大倍率下迭代选择图像块,并随时间聚合证据,从而保留多尺度细节。为了评估 GIANT 并促进可复现性,引入了一个名为 MultiPathQA 的新基准套件,涵盖了五个临床挑战。利用 GPT-5,GIANT 在 MultiPathQA 基准的五个中的四个上展示了最先进的性能,优于专门的病理学问答模型。 AI

影响 这项研究通过使通用多模态模型能够分析复杂的吉比特级图像,有可能提高病理学诊断能力,从而提高准确性和效率。

排序理由 这是一篇详细介绍多模态模型在病理图像分析中的新方法和基准的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Thomas A. Buckley, Kian R. Weihrauch, Katherine Latham, Andrew Z. Zhou, Padmini A. Manrai, Arjun K. Manrai ·

    Navigating Gigapixel Pathology Images with Large Multimodal Models

    arXiv:2511.19652v2 Announce Type: replace Abstract: Recent advances in large multimodal models have allowed for the development of interactive chat models that can converse and reason about pathology whole-slide images (WSIs). However, existing slide-level chat systems are often …