PulseAugur
实时 14:47:14
实体 Reinforced Iterative Classification

Reinforced Iterative Classification

PulseAugur coverage of Reinforced Iterative Classification — every cluster mentioning Reinforced Iterative Classification across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_05087 ·

    新的分类方法使用强化学习来精炼预测

    研究人员推出了一种新颖的方法,称为强化迭代分类(RIC),它从模仿标签转向使用强化学习进行分类任务。该方法采用循环代理来迭代地精炼预测,通过提高准确性获得奖励,并提供随时分类的能力。在图像分类基准测试中,RIC 的准确性与监督方法相当,同时还显示出更好的校准和自适应计算分配。