ENTITY SRPO-Qwen-32B

SRPO-Qwen-32B

PulseAugur coverage of SRPO-Qwen-32B — every cluster mentioning SRPO-Qwen-32B across labs, papers, and developer communities, ranked by signal.

Total · 30d

1

1 over 90d

Releases · 30d

0

0 over 90d

Papers · 30d

1

1 over 90d

TIER MIX · 90D

TOPICS

RECENT · PAGE 1/1 · 1 TOTAL

RESEARCH · CL_05788 · Apr 24 · 02:30

Kwai AI's SRPO achieves DeepSeek-R1-Zero performance with 10x fewer training steps

Researchers from Kuaishou's Kwaipilot team have developed a novel reinforcement learning framework called SRPO, designed to improve the efficiency and performance of large language models. This new method addresses limi…