一项试点研究探讨了使用多模态大语言模型(MLLMs)分析癫痫视频中的病理性运动。研究发现,未经专门训练的MLLMs在许多癫痫特征的识别上优于传统的计算机视觉模型,尤其是在识别姿势和背景元素方面。虽然MLLMs在识别细微、高频运动方面存在困难,但有针对性的预处理技术提高了它们的性能,并且它们对预测的解释与专家推理高度一致。 AI
影响 展示了将通用MLLMs应用于专业临床视频分析的潜力,为可解释的诊断辅助提供了途径。
排序理由 这是一篇发表在arXiv上的研究论文,评估了现有模型的能力。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →