English(EN) Is finetuning GPT4o worth it? — with Alistair Pullen, Cosine (Genie)

Cosine Genie 利用 GPT-4o 微调成为顶级编码代理

作者 PulseAugur 编辑部 · [1 个来源] · 2024-08-22 14:57

Cosine 推出了 Genie，一个编码代理，在 SWE-Bench 基准测试中取得了最高排名，显著超越了之前的领先者。这一成功归功于在数十亿个合成生成的代码和运行时错误 token 上微调 OpenAI 的 GPT-4o 模型。OpenAI 与 Cosine 在微调过程的规模和细节方面进行了合作，包括 LoRA 适配器的动态调整。Genie 采用四阶段工作流程，旨在以适合直接集成到代码库的格式输出代码。 AI

排序理由来自 Cosine 的新编码代理 (Genie) 在 SWE-Bench 上使用微调的 GPT-4o 取得了最先进的结果，这是 AI 编码能力的一项重大进展。

在 Latent Space Podcast 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Latent Space Podcast TIER_1 English(EN) · Latent.Space · 2024-08-22 14:57

微调GPT4o是否值得？——与Alistair Pullen、Cosine (Genie) 对话

<p><a href="https://en.wikipedia.org/wiki/Betteridge%27s_law_of_headlines" target="_blank">Betteridge's law</a> says no: with seemingly infinite flavors of RAG, and >2million token context + prompt caching from Anthropic/Deepmind/Deepseek, it's reasonable to believe that "in cont…

报道来源 [1]

微调GPT4o是否值得？——与Alistair Pullen、Cosine (Genie) 对话

相关实体

相关话题