PulseAugur
实时 11:45:21
实体 Hypentropy Policy Gradient

Hypentropy Policy Gradient

PulseAugur coverage of Hypentropy Policy Gradient — every cluster mentioning Hypentropy Policy Gradient across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_93235 ·

    新算法优化推荐系统中的嵌入模型路由

    一篇新研究论文介绍了一种用于优化推荐系统中嵌入模型路由的Hypentropy Policy Gradient (HPG)算法。该论文将此问题形式化为一个具有低秩专家的对抗性上下文线性老虎机问题,解决了对抗性查询和有限模型可观测性等挑战。HPG旨在适应未知的低秩结构,实现\tilde{\mathcal O}(s\sqrt{MT})的策略遗憾,并提供了一种高效、无参数的实现。