实体
Energy-Based Decoding
Energy-Based Decoding
PulseAugur coverage of Energy-Based Decoding — every cluster mentioning Energy-Based Decoding across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新解码方法在不重新训练的情况下提升LLM评估效果
研究人员开发了一种新颖的方法——基于能量的解码(Energy-Based Decoding, EBD),以改进预训练大语言模型的评估。EBD在解码过程中使用轻量级的奖励模型来引导LLM执行面向任务的行为,而无需更改模型的参数。该方法旨在通过减少与指令遵循和输出格式相关的失败,更公平地评估模型的内在能力,并在多个基准测试和模型上优于现有方法。
-
LLMs explore preference alignment and failure mitigation techniques
Researchers are exploring new methods for aligning large language models (LLMs) with human preferences and mitigating specific failure modes. One approach uses Direct Preference Optimization (DPO) to reduce text degener…