EleutherAI 发布 Pile-T5，一个在 The Pile 上训练并使用 LLaMA 分词器的改进版 T5 模型

作者 PulseAugur 编辑部 · [1 个来源] · 2024-04-14 17:00

EleutherAI 发布了 Pile-T5，这是 T5 语言模型的一个更新版本。新版本在 The Pile 数据集上进行了训练，并使用了 LLaMA 分词器，解决了原始 T5 在处理代码及其预训练数据方面的不足。Pile-T5 的训练 Token 数量是原始 T5 的两倍，并且在性能上有了显著提升，尤其是在代码相关任务上，即使在 Token 数量相同的情况下也优于广泛使用的 T5 模型。 AI

排序理由知名研究团队发布了一个现有开源模型的新改进版本。

在 EleutherAI Blog 阅读 →

模型发布
论文
其他

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

EleutherAI 发布 Pile-T5，一个在 The Pile 上训练并使用 LLaMA 分词器的改进版 T5 模型

报道来源 [1]

EleutherAI Blog TIER_1 English(EN) · 2024-04-14 17:00

Pile-T5

Trained T5 on the Pile

报道来源 [1]

Pile-T5

相关话题