实体
Aritra Mitra
Aritra Mitra
PulseAugur coverage of Aritra Mitra — every cluster mentioning Aritra Mitra across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新分析统一了 SAG、SAGA 和 IAG 算法的收敛性证明
研究人员为 SAG、SAGA 和 IAG 算法开发了一种统一的收敛性分析,这些算法常用于大规模机器学习。这项新分析使用了一种新颖的李雅普诺夫函数和集中度工具来确定随机子采样引起的延迟的界限。由此产生的证明简洁且模块化,为 SAG 和 SAGA 提供了高概率界限,这些界限可以扩展到非凸目标。此外,该技术还为 IAG 算法带来了改进的收敛速度。
-
New Q-learning algorithm robust to corrupted rewards
研究人员开发了一种新的Q学习变体,旨在处理强化学习环境中的对抗性腐败奖励。这种新颖的算法在异步采样条件下进行了分析,并提供了有限时间内的鲁棒性保证。该算法的性能与现有界限相匹配,并增加了一个与腐败样本相关的项,同时确立了一个近乎最优的信息论下界。