实体
GLM 5.2 Fast
GLM 5.2 Fast
PulseAugur coverage of GLM 5.2 Fast — every cluster mentioning GLM 5.2 Fast across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
时间线
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
Fireworks AI推出GLM 5.2 Fast以提高推理速度 · 跟踪2个来源
Fireworks AI发布了GLM 5.2模型的更快版本,名为GLM 5.2 Fast。新版本在保持标准GLM 5.2相同质量的同时,实现了显著更高的推理速度,最高可达每秒140个token。该公司还强调了用于实现更高性能的定制部署选项,指出在Artificial Analysis上速度可达每秒446个token。
-
Fireworks AI 发布更快的 GLM 5.2 以支持代理工作流
Fireworks AI 推出了 GLM 5.2 Fast,这是一款专为代理工作流设计的模型,其运行速度比标准版本快 2-3 倍。这种增强的速度对于处理大上下文、编写计划和使用工具的代理至关重要,使其更加实用且具成本效益。该模型支持 100 万个 token 的上下文窗口,并具有优化的提示缓存功能,为重复使用的上下文提供显著折扣,这是代理操作中的主要成本因素。GLM 5.2 Fast 采用了一种特殊的架构,结合了混合专家模型 (MoE…