研究人员推出了一种新颖的通用相对位置嵌入技术 URoPE,旨在增强 Transformer 模型在几何推理任务中的能力。与仅限于固定几何空间的先前方法不同,URoPE 通过采样 3D 点并将其投影到查询图像平面,可以处理跨视图和跨维度场景。这种无需参数的方法可以与现有的 RoPE 优化注意力核无缝集成,并在新视图合成、3D 对象检测、对象跟踪和深度估计等任务中展示了性能提升。 AI
排序理由 这是一篇介绍 Transformer 模型中位置嵌入新技术的 ist 研究论文。
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →