实体
LambdaRank
LambdaRank
PulseAugur coverage of LambdaRank — every cluster mentioning LambdaRank across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新的RISC方法通过排序答案来提高LLM的准确性
研究人员开发了一种名为Ranking-Improved Self-Consistency (RISC) 的新方法,以提高大型语言模型的准确性。该方法将答案选择视为一个排序问题,超越了简单的多数投票。RISC 利用 LambdaRank 模型,并结合评估答案频率、语义相关性和推理一致性的特征,以提高问答任务的性能。
-
AI解释质量通过排序进行评估,优于回归
研究人员已将AI解释质量的评估从生成任务重新构建为排序问题。模型不再生成单个最佳解释,而是被训练来区分多个候选解释之间的相对质量。这种方法利用列表式和成对排序模型,在区分解释质量等级方面显示出比回归方法更优越的性能。值得注意的是,在高质量数据上训练的小型编码器模型可以达到与大型模型相当的性能,并且这些基于排序的奖励有助于稳定策略优化,而基于回归的奖励则会失败。