ENTITY Sanjeev Manivannan

Sanjeev Manivannan

PulseAugur coverage of Sanjeev Manivannan — every cluster mentioning Sanjeev Manivannan across labs, papers, and developer communities, ranked by signal.

Show in brief

Total · 30d

2 over 90d

Releases · 30d

0 over 90d

Papers · 30d

2 over 90d

TIER MIX · 90D

TOPICS

SENTIMENT · 30D

1 day(s) with sentiment data

RECENT · PAGE 1/1 · 2 TOTAL

TOOL · CL_135370 · Jul 10 · 04:00

New second-order actor-critic method accelerates reinforcement learning

Researchers have developed a novel second-order actor-critic method for reinforcement learning in discounted Markov Decision Processes (MDPs). This approach aims to accelerate convergence by utilizing curvature informat…
TOOL · CL_32664 · May 14 · 15:46

New RL method uses policy Hessian for faster convergence

Researchers have developed a novel second-order actor-critic method for reinforcement learning in discounted Markov Decision Processes. This approach aims to accelerate convergence by incorporating curvature information…

New second-order actor-critic method accelerates reinforcement learning

New RL method uses policy Hessian for faster convergence