实体 Adam Ousherovitch

Adam Ousherovitch

PulseAugur coverage of Adam Ousherovitch — every cluster mentioning Adam Ousherovitch across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 1

发布 · 30天

90 天内 0

论文 · 30天

90 天内 1

层级分布 · 90 天

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_08368 · Apr 27 · 19:52

Compute Aligned Training 优化 LLM 以适应测试时推理策略

研究人员推出了一种名为 Compute Aligned Training 的新训练方法，旨在更好地优化大型语言模型 (LLM) 在推理期间的性能。传统的监督微调 (Supervised Fine-Tuning) 和强化学习 (Reinforcement Learning) 等方法没有考虑到 LLM 在测试时实际的使用方式，而这通常涉及聚合或过滤输出。这种新方法将训练目标与这些特定的测试时策略对齐，推导出新的损失函数，以在这些条件下最大…

Compute Aligned Training 优化 LLM 以适应测试时推理策略