开创性的2017年论文《Attention Is All You Need》引入了Transformer架构,这是现代大型语言模型(如ChatGPT)的基础。该架构通过使模型能够一次性处理整个文本并理解上下文,克服了逐字处理的局限性,从而彻底改变了AI。该论文的作者,八位Google研究人员,此后离开了公司创办了成功的AI初创公司,凸显了他们突破性研究的深远影响。 AI
影响 这篇论文的Transformer架构是所有现代LLM的基石,使其具备了当前的能力。
排序理由 该集群讨论了一篇引入了关键AI架构的基础研究论文。 [lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — fosstodon.org 阅读 →
- Aidan N. Gomez
- Ashish Vaswani
- Attention Is All You Need
- Character.ai
- ChatGPT
- Cohere
- Illia Polosukhin
- Jakob Uszkoreit
- Llion Jones
- Niki Parmar
- Noam Shazeer
- Transformer
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →