实体
Pat
Pat
PulseAugur coverage of Pat — every cluster mentioning Pat across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
时间线
- 2026-05-26 research_milestone A new method called PAT was proposed to accelerate RLHF training. 来源
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新方法通过自适应并行加速 RLHF 训练
研究人员开发了一种名为 PAT 的新方法,以加速人类反馈强化学习 (RLHF) 模型的训练。该技术在生成阶段动态调整张量并行,解决了长响应时间瓶颈化进程的问题。通过智能地重新配置并行和管理解码状态,PAT 已证明在 LLaMA3.1-8B 和 Qwen3-14B 等模型上显著降低了生成和端到端训练的延迟。
-
New methods boost LLM code generation efficiency and theory
Researchers have developed new methods for improving Large Language Model (LLM) code generation efficiency. One approach, Planning-after-Trial (PaT), adaptively invokes a planner only when an initial generation attempt …