实体 Qwen2.5-72B-Instruct

Qwen2.5-72B-Instruct

PulseAugur coverage of Qwen2.5-72B-Instruct — every cluster mentioning Qwen2.5-72B-Instruct across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 2

发布 · 30天

90 天内 0

论文 · 30天

90 天内 2

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

RESEARCH · CL_128458 · Jul 6 · 13:26

AI模型利用Schwartz理论几何改进人类价值观检测

研究人员开发了一种名为Schwartz-Geometry解码的新方法，以改进AI模型中的人类价值观检测。该方法利用了Schwartz价值观的理论结构，该结构将其描述为连续体而非独立标签。通过将这种几何形状作为软偏置应用，特别是通过事后能量解码器，该方法在不牺牲分类准确性的情况下，增强了预测标签集与理论模型的一致性。
TOOL · CL_27514 · May 11 · 07:51

FormalRewardBench benchmark evaluates LLM reward models for theorem proving

研究人员推出了 FormalRewardBench，一个用于评估形式化定理证明中奖励模型的新基准。该基准通过在无需大量重新训练的情况下比较奖励模型，解决了定理证明器强化学习中信用稀疏分配的挑战。FormalRewardBench 包含 250 对偏好数据，并采用了各种错误注入策略，已用于测试多个大型语言模型，结果表明前沿模型在评估证明质量方面表现最佳。

AI模型利用Schwartz理论几何改进人类价值观检测

FormalRewardBench benchmark evaluates LLM reward models for theorem proving