PulseAugur
实时 13:53:01
实体 L-SHADE

L-SHADE

PulseAugur coverage of L-SHADE — every cluster mentioning L-SHADE across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_111532 ·

    新的 Bézier 游走演化框架通过自适应几何增强优化

    研究人员推出了一种新颖的优化框架 Bézier Walk Evolution (BWE),该框架使用由几何驱动的自适应轨迹构建。该方法将 Bézier 曲线与随机游走机制相结合,以平衡元启发式优化中的探索和利用。BWE 的自适应曲线阶数允许从广泛的全局搜索平滑过渡到集中的局部精炼,为传统的受自然启发的(优化)设计提供了一种可解释的替代方案。在基准函数和工程问题上的实验表明,与 L-SHADE 和 CMA-ES 等现有优化器相比,BWE…

  2. TOOL · CL_104648 ·

    进化算法为强化学习发现新颖的奖励机制

    研究人员开发了一个进化框架,用于在深度强化学习中发现发展性奖励机制,旨在探索在训练过程中动机优先级如何转移。该方法将三种受生物学启发的组成部分——自主性、新颖性和反应性——与动态变化的权重相结合。在稀疏奖励的MiniGrid任务上进行测试时,进化方法,特别是L-SHADE和CMA-ES,与手工设计的基线相比,表现和泛化能力均有所提高。有趣的是,发现的机制通常将新颖性作为早期训练信号,这与典型的生物发展模式不同。