实体
Longformer: The Long-Document Transformer
Longformer: The Long-Document Transformer
PulseAugur coverage of Longformer: The Long-Document Transformer — every cluster mentioning Longformer: The Long-Document Transformer across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新的注意力方法应对大语言模型长上下文挑战
研究人员正在开发新的注意力机制来处理大型语言模型中日益增长的长上下文。一种方法,Runtime-Certified Bounded-Error Quantized Attention,使用分层 KV 缓存来压缩内存,同时保证回退到精确注意力,确保语言建模和检索等任务的质量。另一种方法,DashAttention,采用可微分稀疏分层注意力来适应性地选择相关 token,以与全注意力相当的准确性实现高稀疏度,并提供优于现有分层方法的性能。…
-
CLaC系统使用LLM和编码器进行政治言论清晰度检测
研究人员提出了一个用于SemEval-2026任务6的系统,专注于检测政治言论中的清晰度和规避性。他们的方法包括比较微调的编码器和基于提示的大型语言模型(LLM)。LLM集成取得了优异的成绩,在少数类上尤其优于微调编码器,并且他们的代码和配置是公开可用的。