TimeRewarder learns dense rewards from passive videos for RL

By PulseAugur Editorial · [1 sources] · 2026-05-22 04:00

Researchers have developed TimeRewarder, a novel method for learning dense reward signals from passive videos. This technique models temporal distances between frame pairs to estimate task progress, which can then guide reinforcement learning agents. Experiments on ten Meta-World tasks showed TimeRewarder significantly improved success rates and sample efficiency, outperforming manually designed rewards and previous methods. The approach also demonstrated potential in leveraging real-world human videos for scalable reward signal generation. AI

IMPACT Enables more efficient training of reinforcement learning agents by automating reward design from video data.

RANK_REASON The cluster contains a new academic paper detailing a novel method for reinforcement learning. [lever_c_demoted from research: ic=1 ai=1.0]

Read on arXiv cs.AI →

AI-generated summary · Google Gemini · from 1 sources. How we write summaries →

TimeRewarder learns dense rewards from passive videos for RL

COVERAGE [1]

arXiv cs.AI TIER_1 English(EN) · Yuyang Liu, Chuan Wen, Yihang Hu, Dinesh Jayaraman, Yang Gao · 2026-05-22 04:00

TimeRewarder: Learning Dense Reward from Passive Videos via Frame-wise Temporal Distance

arXiv:2509.26627v3 Announce Type: replace Abstract: Designing dense rewards is crucial for reinforcement learning (RL), yet in robotics it often demands extensive manual effort and lacks scalability. One promising solution is to view task progress as a dense reward signal, as it …

COVERAGE [1]

TimeRewarder: Learning Dense Reward from Passive Videos via Frame-wise Temporal Distance

RELATED ENTITIES

RELATED TOPICS