PulseAugur
实时 15:05:53
English(EN) I pretrained and post trained a 500M parameter LLM and 330M parameter Image generator from scratch

开发者训练了 5 亿参数 LLM 和 3.3 亿参数图像生成器

一位开发者创建了 HobbyLM,一个拥有 5 亿参数的大型语言模型,以及一个拥有 3.3 亿参数的图像生成器。该 LLM 在 Fineweb 的 400 亿个 token 上进行了预训练,然后进行了后训练以扩展其上下文窗口。该图像生成器受到 ByteDanceDreamlite 架构的启发,并在 MidjourneyFluxGoogleCCW3 的蒸馏数据集上进行了训练。该项目利用 Claude SDK 构建了一个代理式框架来协调训练过程,模型权重和 Playground 可在 Hugging Face 上获取。 AI

影响 此次发布提供了一个新的开源 LLM 和图像生成器,可能促进在小型 AI 模型方面的进一步研究和开发。

排序理由 该条目描述了定制构建的 LLM 和图像生成器模型的预训练和后训练,属于研究范畴。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

开发者训练了 5 亿参数 LLM 和 3.3 亿参数图像生成器

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/Altruistic-Tea-5612 ·

    I pretrained and post trained a 500M parameter LLM and 330M parameter Image generator from scratch

    <table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1ubuy8w/i_pretrained_and_post_trained_a_500m_parameter/"> <img alt="I pretrained and post trained a 500M parameter LLM and 330M parameter Image generator from scratch" src="https://preview.redd.it/jhjdb0kg1o8h…