PulseAugur
实时 16:53:25
实体 QHyer

QHyer

PulseAugur coverage of QHyer — every cluster mentioning QHyer across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_16071 ·

    QHyer模型通过自适应历史压缩增强离线目标条件强化学习

    研究人员开发了QHyer,一种用于离线目标条件强化学习的新方法,解决了部分可观察和历史依赖数据集带来的挑战。QHyer利用Q估计器指导策略拼接,并采用混合注意力-Mamba骨干进行自适应历史压缩。实验表明,QHyer在非马尔可夫和马尔可夫数据集上均取得了最先进的性能。