English(EN) Stress-testing medical large language models reveals latent safety pathology beyond benchmark accuracy

新框架对医疗LLM进行压力测试，揭示隐藏的安全缺陷

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

开发了一个名为AI-MASLD的新压力测试框架，用于评估医疗大型语言模型在标准准确性基准之外的安全性。该框架揭示了七个测试模型在经受现实叙事压力时存在显著的性能差异，并发现了两种不同的压力反应表型。值得注意的是，在医疗数据上进行微调会降低逻辑稳定性，而一个开放权重模型在安全指标上匹配或超越了专有替代品，这凸显了叙事压力审计的必要性。 AI

影响建立了一种超越准确性的LLM安全评估新方法，对临床部署至关重要。

排序理由该集群包含一篇详细介绍新研究方法和发现的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Yuan Shen, Xiaojun Wu, Linghua Yu · 2026-06-09 04:00

压力测试医疗大语言模型，揭示基准准确性之外潜在的安全病理

arXiv:2606.07929v1 Announce Type: new Abstract: Large language models (LLMs) are entering clinical practice based on benchmark accuracy that may fail to detect safety-relevant failure modes. Here we present AI-MASLD, a stress-audit framework that adapts the logic of metabolic str…

报道来源 [1]

压力测试医疗大语言模型，揭示基准准确性之外潜在的安全病理

相关话题