English(EN) From Token to Token Pair: Efficient Prompt Compression for Large Language Models in Clinical Prediction

新的MedTPE方法以无性能损失的方式压缩电子病历数据以供大型语言模型使用

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-12 08:46

研究人员开发了一种名为Medical Token-Pair Encoding (MedTPE)的新方法，用于高效压缩大型语言模型中长序列的电子健康记录。该技术将频繁出现的医疗Token对合并为单个复合Token，实现了无损压缩，且不增加计算开销或牺牲预测准确性。MedTPE在各种临床预测任务和大型语言模型上显著减少了输入Token长度和推理延迟，同时还显示出对其他领域和语言的鲁棒性和通用性。 AI

影响引入了一种新颖的压缩技术，用于处理长临床数据的LLM，有望降低医疗AI应用的成本并提高效率。

排序理由详细介绍LLM提示压缩新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Tingting Zhu · 2026-05-12 08:46

From Token to Token Pair: Efficient Prompt Compression for Large Language Models in Clinical Prediction

By processing electronic health records (EHRs) as natural language sequences, large language models (LLMs) have shown potential in clinical prediction tasks such as mortality prediction and phenotyping. However, longitudinal or highly frequent EHRs often yield excessively long to…

报道来源 [1]

From Token to Token Pair: Efficient Prompt Compression for Large Language Models in Clinical Prediction

相关实体

相关话题