PulseAugur
实时 10:41:29
实体 Alignment-Aware Decoding

Alignment-Aware Decoding

PulseAugur coverage of Alignment-Aware Decoding — every cluster mentioning Alignment-Aware Decoding across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_68510 ·

    新的推理技术可在无需额外训练的情况下提升大语言模型的对齐能力

    研究人员开发了一种名为对齐感知解码(AAD)的新型推理技术,以提高大语言模型的对齐能力。AAD 在无需标准偏好优化设置(如直接偏好优化 DPO)之外的额外训练的情况下运行。实证结果表明,AAD 在各种对齐基准测试和不同模型规模上始终优于现有基线。此外,当标记数据稀缺时,AAD 可以为对齐任务生成高质量的合成数据。