PulseAugur
实时 02:27:26
Polski(PL) Model Mercury 2 od Inception Labs osiąga prędkość 1000 tokenów na sekundę, wyprzedzając Google DiffusionGemma w testach merytorycznych i rzucając wyzwanie trady

Inception Labs 的 Mercury 2 模型通过并行结晶实现每秒 1000 个 token 的速度 · 跟踪 3 个来源

Inception Labs 发布了 Mercury 2,这是一款能够以每秒超过 1000 个 token 的速度进行推理和生成文本的新型扩散模型。该模型通过使用并行结晶而非线性写入,实现了显著的速度提升,与传统模型相比,延迟降低了 82%。Mercury 2 在基准测试中也超越了 Google 的 DiffusionGemma,对传统的 LLM 架构提出了挑战。 AI

影响 以其并行结晶方法为 LLM 推理速度设定了新基准,并对现有架构提出了挑战。

排序理由 前沿实验室模型发布,附带系统卡。

在 Mastodon — mastodon.social 阅读 →

AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →

Inception Labs 的 Mercury 2 模型通过并行结晶实现每秒 1000 个 token 的速度 · 跟踪 3 个来源

报道来源 [3]

  1. Mastodon — mastodon.social TIER_1 Polski(PL) · aisight ·

    Inception Labs 的 Mercury 2 是首个能够进行推理、每秒生成超过 1000 个 token 的文本的扩散模型。通过放弃

    Mercury 2 od Inception Labs to pierwszy model dyfuzyjny, który potrafi rozumować, generując tekst z prędkością ponad 1000 tokenów na sekundę. Dzięki porzuceniu liniowego pisania na rzecz równoległej krystalizacji danych, system ten redukuje opóźnienia o 82% względem tradycyjnych …

  2. Mastodon — mastodon.social TIER_1 Polski(PL) · aisight ·

    Inception Labs 的 Mercury 2 是首个能够进行推理、每秒生成超过 1000 个 token 的文本的扩散模型。通过放弃

    Mercury 2 od Inception Labs to pierwszy model dyfuzyjny, który potrafi rozumować, generując tekst z prędkością ponad 1000 tokenów na sekundę. Dzięki porzuceniu liniowego pisania na rzecz równoległej krystalizacji danych, system ten redukuje opóźnienia o 82% względem tradycyjnych …

  3. Mastodon — mastodon.social TIER_1 Polski(PL) · aisight ·

    Inception Labs 的 Mercury 2 模型实现每秒 1000 个 token 的速度,在基准测试中超越 Google DiffusionGemma 并挑战传统

    Model Mercury 2 od Inception Labs osiąga prędkość 1000 tokenów na sekundę, wyprzedzając Google DiffusionGemma w testach merytorycznych i rzucając wyzwanie tradycyjnej architekturze LLM. # si # ai # sztucznainteligencja # wiadomości # informacje # technologia https:// aisight.pl/t…