实体
end-to-end reinforcement learning
end-to-end reinforcement learning
PulseAugur coverage of end-to-end reinforcement learning — every cluster mentioning end-to-end reinforcement learning across labs, papers, and developer communities, ranked by signal.
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
3
90 天内 3
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 3 条
-
婴儿运动噪声增强深度强化学习探索
研究人员开发了一种新颖的深度强化学习探索策略,该策略受到婴儿自发运动的启发。该方法引入了模仿婴儿运动控制发展模式的时间相关噪声,与标准的白噪声探索相比,在各种强化学习环境中显示出更高的学习效率。研究结果表明,来自人类运动发展的见解可以为设计更有效的人工智能代理提供信息。
-
新调查详细介绍了端到端多说话人自动语音识别的进展
一篇新近发表在arXiv上的调查论文详细介绍了面向单声道音频的端到端(E2E)多说话人自动语音识别(ASR)的进展。该论文系统地回顾了E2E神经方法,按SIMO和SISO等架构范式进行分类,并讨论了在处理长篇语音和说话人归属方面的改进。它还评估了标准基准上的当前方法,并概述了未来更鲁棒的ASR系统的研究方向。
-
GIFT: Global stabilisation via Intrinsic Fine Tuning
研究人员推出了一种名为全局内在微调稳定(GIFT)的新训练框架,旨在提高深度强化学习(RL)策略的稳定性。当前的深度 RL 策略常常表现出混乱的状态动力学,使其对初始条件敏感并限制了其实际应用。GIFT 通过引入自定义奖励函数,直接优化现有 RL 策略的全局稳定性,旨在在不牺牲任务性能的情况下提高可靠性。