PulseAugur
实时 04:42:29
English(EN) H$^{2}$MT: Semantic Hierarchy-Aware Hierarchical Memory Transformer

H2MT Transformer 提升长上下文大模型效率

研究人员开发了一种名为 H$^{2}$MT 的新型 Transformer 模型,旨在更有效地处理长文本输入。该模型离线构建输入数据的语义层次结构,从而在推理过程中更有效地路由查询。通过及早修剪不相关信息,H$^{2}$MT 旨在与提示压缩和检索增强生成等现有方法相比,减少计算量和延迟。 AI

影响 这种新的模型架构可以使大模型更有效地处理长文档,提高需要广泛上下文的任务的性能。

排序理由 该集群包含一篇详细介绍新模型架构的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Maryam Haghifam, Zifan He, Jason Cong, Yizhou Sun ·

    H$^{2}$MT:语义层级感知分层记忆Transformer

    arXiv:2605.24930v1 Announce Type: new Abstract: Transformer-based LLMs achieve strong results on many language tasks; however, long inputs remain challenging because context windows are finite, and prefill latency and memory grow rapidly with prompt length. Flat token-stream proc…