PulseAugur
EN
LIVE 00:22:23
Deutsch(DE) Auch wenn die meisten von ihnen inzwischen mit GPUs arbeiten: Sprachmodelle an Supercomputern zu trainieren, ist keine Selbstverständlichkeit. Ajay Navilarekal

Leibniz Supercomputing Centre explores training LLMs on SuperMUC-NG Phase 2

The Leibniz Supercomputing Centre (LRZ) is exploring the use of its SuperMUC-NG Phase 2 supercomputer for training large language models, a task that is not trivial even with the widespread use of GPUs. Ajay Navilarekal Rajgopal from LRZ, along with Intel software engineer Nikolai Solmsdorf, will present their findings on this topic at the ISC conference. AI

IMPACT Investigating efficient supercomputing infrastructure for LLM training could accelerate model development and deployment.

RANK_REASON The item discusses research into using a specific supercomputer for training language models, presented at a conference. [lever_c_demoted from research: ic=1 ai=0.7]

Read on Mastodon — fosstodon.org →

AI-generated summary · Google Gemini · from 1 sources. How we write summaries →

Leibniz Supercomputing Centre explores training LLMs on SuperMUC-NG Phase 2

COVERAGE [1]

  1. Mastodon — fosstodon.org TIER_1 Deutsch(DE) · [email protected] ·

    Even though most of them now work with GPUs: Training language models on supercomputers is not a given. Ajay Navilarekal

    Auch wenn die meisten von ihnen inzwischen mit GPUs arbeiten: Sprachmodelle an Supercomputern zu trainieren, ist keine Selbstverständlichkeit. Ajay Navilarekal Rajgopal (LRZ), hat untersucht, wie SuperMUC-NG Phase 2 eingesetzt werden kann, um GPT-Style-Modelle zu trainieren. Geme…