PulseAugur
实时 03:53:03
实体 Adam Ousherovitch

Adam Ousherovitch

PulseAugur coverage of Adam Ousherovitch — every cluster mentioning Adam Ousherovitch across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_08368 ·

    Compute Aligned Training 优化 LLM 以适应测试时推理策略

    研究人员推出了一种名为 Compute Aligned Training 的新训练方法,旨在更好地优化大型语言模型 (LLM) 在推理期间的性能。传统的监督微调 (Supervised Fine-Tuning) 和强化学习 (Reinforcement Learning) 等方法没有考虑到 LLM 在测试时实际的使用方式,而这通常涉及聚合或过滤输出。这种新方法将训练目标与这些特定的测试时策略对齐,推导出新的损失函数,以在这些条件下最大…