PulseAugur
实时 10:11:40
实体 BlendServe

BlendServe

PulseAugur coverage of BlendServe — every cluster mentioning BlendServe across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
时间线
  1. 2026-06-09 research_milestone A new paper introduces BlendServe, a system for optimizing offline inference of large language models. 来源
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_80109 ·

    BlendServe系统提升LLM离线推理吞吐量

    研究人员开发了BlendServe,一个旨在优化自回归大语言模型离线推理的新系统。BlendServe结合了资源重叠和前缀共享技术,以最大化吞吐量并降低对延迟不敏感应用的成本。评估显示,与vLLM和SGLang等现有标准相比,BlendServe的吞吐量可提高高达1.44倍。