English(EN) Seizure-Semiology-Suite (S3): A Clinically Multimodal Dataset, Benchmark, and Models for Seizure Semiology Understanding

新数据集和基准测试 LLM 对癫痫视频的理解能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-22 04:00

研究人员开发了 Seizure-Semiology-Suite (S3)，这是一个新的数据集和基准，旨在评估多模态大语言模型 (MLLM) 从视频理解复杂癫痫半肢体学能力。S3 数据集包含 438 个癫痫视频和超过 35,000 个标签，支持一个七任务基准，评估 MLLM 在从视觉感知到临床报告的各种性能方面。对 11 个开源 MLLM 的初步评估显示，在侧别推理和时间定位等方面存在明显不足，尽管针对癫痫的微调显示出改进的潜力。 AI

影响为评估安全关键型医疗视频分析中的多模态 AI 建立了新的基准，指导临床可靠性的发展。

排序理由学术论文，介绍用于多模态 LLM 在医学领域评估的新数据集和基准。 [lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Lina Zhang, Tonmoy Monsoor, Peizheng Li, Jiarui Cui, Xinyi Peng, Chong Han, Prateik Sinha, Siyuan Dai, Jessica Nichole Pasqua, Colin M McCrimmon, Weiting Liu, Hailey Marie Miranda, Bing Hu, Xiangting Wu, Tengyou Xu, Chunhan Li, Jiaye Tian, Jiarui Tang, D… · 2026-05-22 04:00

Seizure-Semiology-Suite (S3): A Clinically Multimodal Dataset, Benchmark, and Models for Seizure Semiology Understanding

arXiv:2605.21852v1 Announce Type: new Abstract: While Multimodal Large Language Models (MLLMs) have demonstrated remarkable proficiency in general video understanding, their capacity to interpret involuntary, and spatio-temporally evolving pathologic motor behaviors such as seizu…

报道来源 [1]

Seizure-Semiology-Suite (S3): A Clinically Multimodal Dataset, Benchmark, and Models for Seizure Semiology Understanding

相关实体

相关话题