English(EN) Generative modeling with sparse transformers

OpenAI 的 Sparse Transformer 在序列预测方面创下新纪录

作者 PulseAugur 编辑部 · [1 个来源] · 2019-04-23 07:00

OpenAI 开发了一种名为 Sparse Transformer 的新型深度神经网络，它显著提升了生成建模能力。该模型采用了一种重新设计的注意力机制，能够处理比以往长 30 倍的序列，使其能够捕捉图像、文本和声音等数据中复杂、长距离的依赖关系。通过采用稀疏注意力模式和优化内存使用，Sparse Transformer 可以处理包含数万个元素和数百层的序列，并在各个领域取得了最先进的性能。 AI

排序理由这是一篇研究论文，详细介绍了 OpenAI 在 Transformer 架构方面的一项新算法改进。

在 OpenAI News 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

OpenAI 的 Sparse Transformer 在序列预测方面创下新纪录

报道来源 [1]

OpenAI News TIER_1 English(EN) · 2019-04-23 07:00

Generative modeling with sparse transformers

We’ve developed the Sparse Transformer, a deep neural network which sets new records at predicting what comes next in a sequence—whether text, images, or sound. It uses an algorithmic improvement of the attention mechanism to extract patterns from sequences 30x longer than possib…

报道来源 [1]

Generative modeling with sparse transformers

相关实体

相关话题