PulseAugur
实时 23:16:44
English(EN) Deterministic Inference across Tensor Parallel Sizes That Eliminates Training-Inference Mismatch

新内核确保跨张量并行大小的确定性LLM推理

研究人员开发了基于树的不变内核(TBIK),以确保大型语言模型(LLM)的确定性推理,无论张量并行(TP)大小如何。这解决了由于TP大小和浮点算术的差异导致相同输入产生不同输出的关键问题。TBIK通过分层二叉树结构对齐归约顺序,保证了逐位可复现性,这对于LLM作为裁判和强化学习等应用至关重要。 AI

影响 确保RL和评估等关键应用的LLM输出一致,消除了可靠部署的一个主要障碍。

排序理由 该集群包含一篇学术论文,详细介绍了改进LLM推理的新技术方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv stat.ML TIER_1 English(EN) · Ziyang Zhang, Xinheng Ding, Jiayi Yuan, Rixin Liu, Huizi Mao, Jiarong Xing, Zirui Liu ·

    Deterministic Inference across Tensor Parallel Sizes That Eliminates Training-Inference Mismatch

    arXiv:2511.17826v2 Announce Type: replace-cross Abstract: Deterministic inference is increasingly critical for large language model (LLM) applications such as LLM-as-a-judge evaluation, multi-agent systems, and Reinforcement Learning (RL). However, existing LLM serving frameworks…