实体 Zyphra

Zyphra

PulseAugur coverage of Zyphra — every cluster mentioning Zyphra across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 11

发布 · 30天

90 天内 0

论文 · 30天

90 天内 5

层级分布 · 90 天

research 4
tool 5
commentary 2

主题

关系

时间线

2026-05-19 funding AI startup Zyphra is raising $500 million at a $5 billion valuation.

情绪 · 30 天

4 天有情绪数据

最近 · 第 1/1 页 · 共 11 条

COMMENTARY · CL_114771 · Jun 28 · 17:03

Open AI 模型生态系统因小众参与者和不同动机而多元化 · 跟踪 1 个来源

开源 AI 模型生态系统正在迅速多元化，从少数主导者扩展到全球众多小众公司。这种扩张的驱动因素多种多样，包括旨在创建前沿模型的公司、利用发布来扩大生态系统参与度和硬件销售的科技巨头，以及训练专业化、小型模型的以产品为中心的公司。这一趋势表明，未来将是长尾模型而非少数几个追逐绝对前沿的模型，开放式开发通过共享方法和数据促进创新。
SIGNIFICANT · CL_105330 · Jun 23 · 07:02

Zyphra 的 ZAYA1-8B 模型在 AMD 硬件上展现出强大的推理能力

Zyphra 发布了 ZAYA1-8B，这是一个获得 Apache 2.0 许可的混合专家（Mixture-of-Experts）推理模型，拥有 84 亿总参数和约 7.6 亿激活参数。值得注意的是，该模型完全在 AMD Instinct MI300X GPU 上训练，展示了开源 AI 生态系统的硬件多样性。虽然 ZAYA1-8B 在同等规模的模型中，在数学和推理基准测试上表现强劲，接近前沿模型，但其最佳性能依赖于 Zyphra 对 …
TOOL · CL_89003 · Jun 13 · 08:33

Zyphra 发布 ZONOS2，一款 80 亿参数的实时 TTS 模型

Zyphra 发布了 ZONOS2，一个开源的、实时的文本到语音模型，拥有 80 亿总参数和 9 亿激活参数以实现高效推理。这款稀疏专家混合（MoE）模型在高质量、零样本语音克隆方面表现出色，旨在克服语音质量和速度之间的典型权衡。ZONOS2 处理原始 UTF-8 字节而非音素，增强了对多种语言和语码转换的支持，并接受了超过 600 万小时音频数据的训练。
RESEARCH · CL_86018 · Jun 11 · 08:49

Zyphra 发布 Zamba2-VL 混合视觉语言模型

Zyphra 推出了 Zamba2-VL，一个新推出的开源视觉语言模型家族。这些模型采用了结合 Mamba2 状态空间模型和 Transformer 的混合架构，与传统的 Transformer 模型相比，处理速度显著提高。Zamba2-VL 提供 1.2B、2.7B 和 7B 参数规模的版本，基准测试表明其在提高速度的同时也具有高准确性。
TOOL · CL_89434 · Jun 11 · 02:20

Zyphra发布ZONOS2文本转语音模型

Zyphra发布了ZONOS2，这是一个在超过600万小时的多语言语音数据上训练的新文本转语音模型。该模型旨在匹配或超越领先的TTS提供商的质量和表现力，同时保持低延迟。ZONOS2特别擅长高保真语音克隆，并利用混合专家（MoE）架构作为其骨干。
SIGNIFICANT · CL_43334 · May 22 · 03:28

Zyphra 发布 ZAYA1-8B MoE 模型，活跃参数不足 10 亿

Zyphra 发布了 ZAYA1-8B，一个拥有 84 亿参数的混合专家（Mixture-of-Experts）模型，每个 token 仅激活约 7.6 亿参数。该架构使其在数学和编码基准测试中能够达到与更大模型相媲美的性能，包括 Claude 4.5 Sonnet。该模型采用了压缩卷积注意力（Compressed Convolutional Attention）和基于 MLP 的专家选择路由器等架构改进，并在大量 AMD Insti…
RESEARCH · CL_33720 · May 15 · 20:23

Zyphra 的 ZAYA1 模型将 AI 推理速度提升 7.7 倍

Zyphra 推出了 ZAYA1-8B-Diffusion-Preview 模型，该模型将自回归 MoE 语言模型转变为离散扩散模型。据报道，这项创新在没有任何性能下降的情况下实现了高达 7.7 倍的推理速度提升。该开发被定位为 AI 推理速度的重大进步。
COMMENTARY · CL_31917 · May 14 · 15:59

新的大型语言模型因过大或过于复杂而无法在家庭实验室运行

作者详细说明了最近发布的三个大型语言模型——DeepSeek V4-Pro、DeepSeek V4-Flash 和 Zyphra ZAYA1-8B——目前为何无法在典型的家庭实验室硬件上运行。DeepSeek V4-Pro 体积过大，为 805 GB，需要数据中心规模。DeepSeek V4-Flash 虽然体积较小，但仍需要大量内存，并且缺乏广泛的软件支持。Zyphra ZAYA1-8B 体积合适，但使用了新颖的架构，尚未开发出相应的推理软件。
TOOL · CL_22192 · May 8 · 04:00

Zyphra 的 ZAYA1-8B 模型以 7 亿激活参数媲美更大模型

Zyphra 发布了 ZAYA1-8B，这是一款专注于推理的混合专家模型，拥有 7 亿激活参数。该模型在 AMD 计算平台上从头开始训练，并采用了新颖的四阶段强化学习级联。ZAYA1-8B 通过采用专注于推理的训练方法和保留答案的修剪方案，在数学和编码基准测试中表现出竞争力，即使与规模大得多的模型相比也是如此。
TOOL · CL_20915 · May 7 · 09:00

Zyphra 的 ZAYA1-8B 模型以不足 10 亿参数匹配顶级 AI 基准

Zyphra 发布了 ZAYA1-8B，这是一个开源模型，在数学基准测试中取得了与 DeepSeek-R1 相媲美的性能。该模型在编码任务方面也展现出与 Claude Sonnet 4.5 相竞争的推理能力，并接近 Gemini 2.5 Pro 的水平。值得注意的是，ZAYA1-8B 的活跃参数少于 10 亿。
RESEARCH · CL_15158 · May 4 · 23:15

Zyphra的TSP策略将LLM训练吞吐量提升2.6倍

Zyphra开发了一种名为张量与序列并行（TSP）的新技术，旨在优化大型Transformer模型的训练与推理。这种硬件感知的策略结合了张量并行和序列并行的方面，能够更有效地在GPU之间分配模型权重和输入序列。基准测试表明，TSP的吞吐量最高可达现有方法的2.6倍，同时还能减少每GPU的内存使用量。

Open AI 模型生态系统因小众参与者和不同动机而多元化 · 跟踪 1 个来源

Zyphra 的 ZAYA1-8B 模型在 AMD 硬件上展现出强大的推理能力

Zyphra 发布 ZONOS2，一款 80 亿参数的实时 TTS 模型

Zyphra 发布 Zamba2-VL 混合视觉语言模型

Zyphra发布ZONOS2文本转语音模型

Zyphra 发布 ZAYA1-8B MoE 模型，活跃参数不足 10 亿

Zyphra 的 ZAYA1 模型将 AI 推理速度提升 7.7 倍

新的大型语言模型因过大或过于复杂而无法在家庭实验室运行

Zyphra 的 ZAYA1-8B 模型以 7 亿激活参数媲美更大模型

Zyphra 的 ZAYA1-8B 模型以不足 10 亿参数匹配顶级 AI 基准

Zyphra的TSP策略将LLM训练吞吐量提升2.6倍