实体
Viktor Stein
Viktor Stein
PulseAugur coverage of Viktor Stein — every cluster mentioning Viktor Stein across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新的 KL 散度类似物改进了强化学习控制
研究人员引入了作为 Kullback-Leibler (KL) 散度类似物的新散度,解决了其在强化学习中的局限性,特别是在分布不匹配或低噪声场景下。这些基于 Wasserstein 和 Kalman-Wasserstein 几何的新型散度即使在分布退化时也能保持有限。该研究证明了它们在线性高斯噪声最优控制中的有效性,表明它们可以防止奇异性并提高双积分器和倒立摆等示例的性能。
-
新的秩统计量方法逼近 f-散度
研究人员开发了一种逼近 f-散度(一类用于量化概率分布之间差异的统计量)的新颖方法。这种称为秩统计量逼近的新技术,通过直接分析秩的分布,绕过了显式密度比估计的需要。该方法被证明可以提供真实 f-散度的下界,并通过随机投影为高维数据提供收敛速度。实证验证包括与神经网络的基准测试以及在生成模型实验中的应用。