PulseAugur
实时 08:02:22
实体 Generative Meta-Learning with Human Feedback (GMHF)

Generative Meta-Learning with Human Feedback (GMHF)

PulseAugur coverage of Generative Meta-Learning with Human Feedback (GMHF) — every cluster mentioning Generative Meta-Learning with Human Feedback (GMHF) across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_121062 ·

    新的GMHF框架通过人类反馈增强机器学习泛化能力

    研究人员推出了一种新的框架——生成式元学习与人类反馈(GMHF),旨在提高机器学习模型在目标领域数据有限或无数据情况下的泛化能力。GMHF框架利用专家直觉指导数据合成,理论上通过使生成数据分布与人类对目标领域的信念保持一致来减少泛化误差。这通过条件神经ODE(cNODE)和基于反馈优化物理参数的强化学习(RL)代理来实现,引导元学习器趋向未见过的分布。在非线性Duffing振子和概率模型上的实验表明,当专家反馈可靠时,GMHF能显著降…