实体 Elynn Chen

Elynn Chen

PulseAugur coverage of Elynn Chen — every cluster mentioning Elynn Chen across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_51474 · May 26 · 04:00

新的强化学习方法通过贝尔曼对齐改进迁移学习

研究人员引入了一种名为一步贝尔曼对齐（RWT）的新方法，以改进在线强化学习中的迁移学习。该技术解决了在学习新目标任务时使用相关源任务数据所带来的挑战，这些数据可能引入偏差并使性能保证失效。RWT 纠正了任务转换中的不匹配，从而能够对源数据进行统计上有效的重用，并带来改进的遗憾界限，尤其是在使用 RKHS 等复杂函数逼近时。在表格和神经网络设置中的实证结果表明，RWT 的性能优于单任务学习和朴素数据池化。