两篇新研究论文介绍了推进AI能力的新颖方法。BenchEvolver 专注于通过演化现有问题来创建更具挑战性的编码基准,旨在克服基准饱和并改进模型训练。ToolSelf 提出了一种用于LLM智能体的运行时自我重构范式,允许它们在任务执行期间动态调整其工具和策略,以增强泛化能力和性能。 AI
影响 这些进展可能带来更强大的AI评估和更具适应性的AI智能体,从而突破当前模型能力的界限。
排序理由 两篇介绍AI研究新颖方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →