实体
Polaris
Polaris
PulseAugur coverage of Polaris — every cluster mentioning Polaris across labs, papers, and developer communities, ranked by signal.
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
3
90 天内 3
层级分布 · 90 天
时间线
- 2026-05-26 research_milestone A new framework called POLARIS was introduced for systematic AI safety testing. 来源
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 3 条
-
New framework POLARIS automates LLM safety testing using formal logic
Researchers have developed a new framework called POLARIS to improve the safety testing of large language models. This system translates natural language policies into formal logic, creating a graph that helps identify …
-
新的平衡聚合方法改进了 LLM 的 GRPO 训练
研究人员已识别并提出了 GRPO 风格训练中聚合偏差的解决方案,这是一种用于增强大型语言模型推理和代码生成的方法。研究表明,标准的 GRPO 聚合方法,即序列聚合和标记聚合,会引入不同的优化偏差。为了对抗这种偏差,他们引入了平衡聚合(BA),这是一种即插即用的替代方案,可提高训练稳定性和性能。使用 Qwen2.5-Math-7B 和 Qwen3-1.7B 模型进行的实验证明了 BA 在各种推理和编码基准测试中的有效性。
-
Polaris 框架使用极坐标几何来改进分层概念学习
研究人员推出 Polaris,一个旨在改进分类法和本体论等分层数据结构学习的新框架。该系统利用极坐标超球嵌入方法,通过角度几何和半径将语义含义与分层结构分离开来。Polaris 旨在提高复杂分层内信息学习和检索的准确性和效率,在各种分类法扩展任务中展示了比现有方法显著的改进。