实体
Pieter Abbeel
Pieter Abbeel
PulseAugur coverage of Pieter Abbeel — every cluster mentioning Pieter Abbeel across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
Engram 通过将知识嵌入权重而非仅限于上下文来引领AI“记忆”
AI初创公司Engram正在开发一种新颖的AI记忆和持续学习方法,旨在将专业知识直接嵌入模型权重,而不是仅仅依赖检索增强生成(RAG)或大型上下文窗口。该公司由理论神经科学和计算机系统架构领域的专家创立,他们认为这种方法将使AI模型能够更像经验丰富的员工一样运作,直观地理解特定的组织知识。Engram的策略涉及轻量级训练技术和适配器,并着眼于为每个人和每个团队打造个性化AI模型的长远愿景。
-
OpenAI 通过 Dota 2、安全性和泛化性推进强化学习
OpenAI 发布了一系列研究论文,详细介绍了强化学习方面的进展。其中包括 OpenAI Five 在 Dota 2 中取得超越人类的表现,开发了 RL 安全探索的基准,并使用 CoinRun 环境量化了泛化能力。该公司还探索了新颖的方法,例如基于预测的奖励以实现好奇心驱动的探索,学习多智能体系统中的策略表示,以及一种名为 Evolved Policy Gradients 的实验性元学习方法,以加快新任务的训练速度。进一步的研究解决了…