English(EN) TOPS: First-Principles Visual Token Pruning via Constructing Token Optimal Preservation Sets for Efficient MLLM Inference

新的TOPS方法剪枝视觉令牌以实现高效的MLLM推理

作者 PulseAugur 编辑部 · [3 个来源] · 2026-06-25 06:45

研究人员开发了TOPS，一种用于剪枝多模态大语言模型（MLLM）中视觉令牌以提高效率的新颖方法。与依赖注意力分数或令牌相似性的先前方法不同，TOPS使用基于第一性原理的信息论框架，根据任务相关性、信息覆盖率和语义多样性来识别关键令牌。这个无需训练且模型无关的模块已经在各种MLLM中展示了显著的性能提升，特别是在LLaVA-NeXT上将视觉令牌减少了77%以上，同时保持甚至略微提高了性能。 AI

影响这项研究为减少MLLM中的计算开销提供了一种有前景的方法，有望带来更高效、更易于访问的多模态AI应用。

排序理由该集群描述了一篇详细介绍一种新颖方法以提高多模态大语言模型效率的研究论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 3 个来源。我们如何撰写摘要 →

报道来源 [3]

arXiv cs.AI TIER_1 English(EN) · Tinghao Wang, Yichen Guo, Rui Huang, Zheng Lu, Qizhe Zhang, Chenxi Li, Yuan Zhang, Jiajun Cao, Zhirong Shen, Yaosong Du, Guangyan Gan, Wenya Wang, Lin William Cong, Shanghang Zhang · 2026-06-26 04:00

TOPS: First-Principles Visual Token Pruning via Constructing Token Optimal Preservation Sets for Efficient MLLM Inference

arXiv:2606.27161v1 Announce Type: new Abstract: Multimodal large language models (MLLMs) have achieved strong multimodal reasoning capabilities, but their efficiency is limited by the large number of visual tokens, which introduces substantial computational overhead. Visual token…
arXiv cs.AI TIER_1 English(EN) · Shanghang Zhang · 2026-06-25 15:29

TOPS: First-Principles Visual Token Pruning via Constructing Token Optimal Preservation Sets for Efficient MLLM Inference

Multimodal large language models (MLLMs) have achieved strong multimodal reasoning capabilities, but their efficiency is limited by the large number of visual tokens, which introduces substantial computational overhead. Visual token pruning offers a natural solution, yet existing…
雷峰网 (Leiphone) TIER_1 中文(ZH) · 2026-06-25 06:45

GAIR Paper 106 | Tracking the Evolutionary Trajectory of Visual Tokens for Lossless Compression and 60% Inference Acceleration | CVPR 2026

<section style="text-align: center; margin: 0px 16px; line-height: 1.75em; display: block;"><img class="rich_pages wxw-img" src="https://static.leiphone.com/uploads/new/images/20260625/6a3ccdfdecdb8.jpg?imageMogr2/quality/90" style="width: 100%; display: inline-block; text-align:…

报道来源 [3]

TOPS: First-Principles Visual Token Pruning via Constructing Token Optimal Preservation Sets for Efficient MLLM Inference

TOPS: First-Principles Visual Token Pruning via Constructing Token Optimal Preservation Sets for Efficient MLLM Inference

GAIR Paper 106 | Tracking the Evolutionary Trajectory of Visual Tokens for Lossless Compression and 60% Inference Acceleration | CVPR 2026

相关实体

相关话题