English(EN) H$^{2}$MT: Semantic Hierarchy-Aware Hierarchical Memory Transformer

H2MT Transformer 提升长上下文大模型效率

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-26 04:00

研究人员开发了一种名为 H$^{2}$MT 的新型 Transformer 模型，旨在更有效地处理长文本输入。该模型离线构建输入数据的语义层次结构，从而在推理过程中更有效地路由查询。通过及早修剪不相关信息，H$^{2}$MT 旨在与提示压缩和检索增强生成等现有方法相比，减少计算量和延迟。 AI

影响这种新的模型架构可以使大模型更有效地处理长文档，提高需要广泛上下文的任务的性能。

排序理由该集群包含一篇详细介绍新模型架构的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Maryam Haghifam, Zifan He, Jason Cong, Yizhou Sun · 2026-05-26 04:00

H$^{2}$MT：语义层级感知分层记忆Transformer

arXiv:2605.24930v1 Announce Type: new Abstract: Transformer-based LLMs achieve strong results on many language tasks; however, long inputs remain challenging because context windows are finite, and prefill latency and memory grow rapidly with prompt length. Flat token-stream proc…