PulseAugur
实时 08:44:22
实体 Decision Transformer

Decision Transformer

PulseAugur coverage of Decision Transformer — every cluster mentioning Decision Transformer across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
3
90 天内 3
层级分布 · 90 天
最近 · 第 1/1 页 · 共 3 条
  1. TOOL · CL_21965 ·

    SlimDT论文提出在顺序建模外注入RTG

    研究人员开发了SlimDT,这是Decision Transformer (DT)模型在离线强化学习中的一种改进。SlimDT将Return-to-Go (RTG)令牌从自回归序列中移除,而是直接将其信息注入状态表示中。这种方法将序列长度减少了三分之一,从而提高了推理效率和计算收益。在D4RL基准测试上的实验表明,SlimDT的性能优于标准DT,并达到了与最先进方法相当的性能。

  2. TOOL · CL_16071 ·

    QHyer模型通过自适应历史压缩增强离线目标条件强化学习

    研究人员开发了QHyer,一种用于离线目标条件强化学习的新方法,解决了部分可观察和历史依赖数据集带来的挑战。QHyer利用Q估计器指导策略拼接,并采用混合注意力-Mamba骨干进行自适应历史压缩。实验表明,QHyer在非马尔可夫和马尔可夫数据集上均取得了最先进的性能。

  3. RESEARCH · CL_14136 ·

    Gemma 4 31B weights show cross-modal transfer via thin trainable interface

    Researchers have demonstrated that frozen weights from the Gemma 4 31B text-pretrained model can be effectively reused across different modalities, including robotics and associative recall tasks. By employing a thin, t…