PulseAugur
实时 05:11:00
实体 mpi

mpi

PulseAugur coverage of mpi — every cluster mentioning mpi across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_01553 ·

    OpenAI发布Proximal Policy Optimization,实现更简单、有效的强化学习

    OpenAI发布了Proximal Policy Optimization (PPO),这是一种新的强化学习算法,其性能可与现有方法媲美或更优,同时实现更简单的实现和调优。PPO在易用性、样本效率和超参数调优之间取得了平衡,使其成为深度神经网络控制任务的宝贵工具。该版本包括使用TensorFlow和MPI的可扩展、并行Python 3实现,以及提供显著速度提升的GPU版本PPO2。