实体
Yaniv Oren
Yaniv Oren
PulseAugur coverage of Yaniv Oren — every cluster mentioning Yaniv Oren across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新的PMCTS算法实现了原则性的并行推理扩展
研究人员开发了粒子蒙特卡洛树搜索(PMCTS),这是一种新颖的算法,旨在解决蒙特卡洛树搜索(MCTS)在神经网络评估中并行化所面临的挑战。与传统的顺序MCTS不同,PMCTS提供了一种原则性的方法来实现并行推理时间扩展,同时保持正式的策略改进保证。实证结果表明,PMCTS能够有效地随着并行计算能力的提升而扩展,并在多个领域超越现有的基于启发式的方法。
-
新的MCTS方法增强了可解释性和效率
研究人员开发了新的方法来提高蒙特卡洛树搜索(MCTS)算法的可解释性和效率。一种方法使用大型语言模型从搜索轨迹中生成MCTS决策的端到端解释,无需手动逻辑约束。另一项开发,双序贯蒙特卡洛树搜索(TSMCTS),解决了序贯蒙特卡洛(SMC)方法中的方差和路径退化问题,在各种环境中表现优于现有的SMC和MCTS基线。