English(EN) From Prompt Optimization to Multi-Dimensional Credibility Evaluation: Enhancing Trustworthiness of Chinese LLM-Generated Liver MRI Reports -- with Preliminary Extension to Lung Cancer

AI模型在生成放射学报告可信度方面接受评估

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-26 04:00

研究人员开发了一个多维度可信度评估（MDCA）框架，用于评估AI生成的放射学报告的可信度。该研究侧重于提升大模型生成的肝脏MRI报告，并探索了提示优化技术。使用SiliconFlow平台评估了几种先进的大模型，包括Kimi-K2-Instruct-0905、Qwen3-235B-A22B-Instruct-2507、DeepSeek-V3和ByteDance-Seed-OSS-36B-Instruct。 AI

影响建立了一个评估AI生成医疗报告的框架，有望提高诊断准确性并增强医疗领域对AI工具的信任。

排序理由该集群包含一篇详细介绍新框架和现有模型评估的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Qiuli Wang, Xinhuang Sun, Yonglin Chen, Jie Cheng, Yongxu Liu, Xingpeng Zhang, Xiaoming Li, Wei Chen · 2026-05-26 04:00

从提示词优化到多维度可信度评估：提升中文大模型生成肝脏MRI报告的可信度——并初步扩展至肺癌

arXiv:2510.23008v3 Announce Type: replace Abstract: Large language models (LLMs) have demonstrated promising performance in generating diagnostic conclusions from imaging findings, thereby supporting radiology reporting, trainee education, and quality control. However, systematic…

报道来源 [1]

从提示词优化到多维度可信度评估：提升中文大模型生成肝脏MRI报告的可信度——并初步扩展至肺癌

相关实体

相关话题