PulseAugur
实时 22:40:01
实体 Aggregation-Expectation-Transformation

Aggregation-Expectation-Transformation

PulseAugur coverage of Aggregation-Expectation-Transformation — every cluster mentioning Aggregation-Expectation-Transformation across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_119511 ·

    新的AETDICE框架统一了多目标强化学习中的非线性目标

    研究人员推出AETDICE,一个旨在统一和优化多目标强化学习(MORL)中非线性目标的新框架。这种名为聚合-期望-变换(AET)框架的新方法,弥合了之前两个独立范式——标量化期望回报(SER)和期望标量化回报(ESR)之间的差距。AETDICE是一种离线强化学习算法,它利用AET框架,能够从静态数据集中进行基于样本的优化,解决了风险规避和公平性等复杂权衡问题,这些问题以前难以处理。