实体
Parameter Golf
Parameter Golf
PulseAugur coverage of Parameter Golf — every cluster mentioning Parameter Golf across labs, papers, and developer communities, ranked by signal.
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 3 条
-
OpenAI AI 代理赢得招聘竞赛;Anthropic 发布 Claude Fable 5
OpenAI 最近结束了一场为期 44 天的机器学习招聘竞赛,其中一个自主 AI 代理的表现优于人类参赛者。该竞赛名为 Parameter Golf,旨在挑战研究人员在特定的规模和计算限制内开发最高效的小型语言模型。与此同时,Anthropic 推出了其新的 AI 模型 Claude Fable 5,该公司声称这是其迄今为止最强大的模型,并在软件开发任务中表现出色。
-
AI代理Aiden在OpenAI的Parameter Golf招聘挑战赛中名列前茅
一个名为Aiden的自主研究代理在OpenAI的Parameter Golf招聘挑战赛中,表现超越了千余名人类参赛者。Aiden提交了25个拉取请求,其中7个创下了排行榜记录,显著优于下一位表现最好的人类研究员。该代理还通过整合人类贡献者开发的新分词器,展示了协作潜力,带来了显著的性能提升。
-
自动化代理自主开发AI训练配方
研究人员开发了一个自动化研究系统,该系统使用专业代理来创建有效的AI训练配方。该系统作为一个封闭的经验循环运行,每次试验都包括一个假设、代码编辑和结果,反馈会塑造后续的建议。代理自主编写代码、提交实验,并根据崩溃或准确性未达标等结果来改进配方,从而在各种基准测试中显著提高模型性能和效率。