English(EN) Names Don't Matter: Symbol-Invariant Transformer for Open-Vocabulary Learning

新的Transformer架构处理可互换的标记以实现开放词汇学习

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-03 04:00

研究人员开发了一种新的基于Transformer的机制，旨在处理可互换的标记，这些标记是语义上等同但不同的符号，例如绑定变量。该方法旨在通过确保模型对其重命名不变来提高对未见符号的泛化能力。所提出的方法使用并行嵌入流和聚合注意力机制来隔离和共享这些标记之间的信息，在开放词汇任务上显示出显著的性能提升。 AI

影响这种新架构可以提高AI模型对新符号和概念的泛化能力，从而提高在开放词汇任务上的性能。

排序理由该集群包含一篇详细介绍新型模型架构的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · \.Ilker I\c{s}{\i}k, Wenchao Li · 2026-06-03 04:00

名称不重要：符号不变Transformer用于开放词汇学习

arXiv:2601.23169v2 Announce Type: replace Abstract: Current neural architectures lack a principled way to handle interchangeable tokens, i.e., symbols that are semantically equivalent yet distinguishable, such as bound variables. As a result, models trained on fixed vocabularies …

报道来源 [1]

名称不重要：符号不变Transformer用于开放词汇学习

相关实体

相关话题