PulseAugur
实时 08:13:33
Deutsch(DE) 19 Tage autonom programmieren: Epoch AI testet mit MirrorCode, wie weit Modelle ohne Originalcode kommen. Claude Opus 4.7 führt mit 56 % und baute ein 16.000-Ze

Claude Opus 4.7在14小时内自主构建了16000行工具集

Epoch AI开发了一个名为MirrorCode的基准测试,用于测试AI模型自主编程的能力。在最近的一次测试中,Claude Opus 4.7在14小时内成功构建了一个16000行的工具集,展示了其在自主编码能力方面的显著进步。这一进展对于未来的代理工作流和自动化代码审查流程尤为重要。 AI

影响 展示了自主编码能力的显著进步,对代理工作流和代码审查具有重要意义。

排序理由 研究基准测试AI模型自主编码能力。[lever_c_demoted from research: ic=1 ai=1.0]

在 Mastodon — mastodon.social 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Claude Opus 4.7在14小时内自主构建了16000行工具集

报道来源 [1]

  1. Mastodon — mastodon.social TIER_1 Deutsch(DE) · aisyndicate ·

    19 days of autonomous programming: Epoch AI tests with MirrorCode how far models can go without original code. Claude Opus 4.7 leads with 56% and built a 16,000-line

    19 Tage autonom programmieren: Epoch AI testet mit MirrorCode, wie weit Modelle ohne Originalcode kommen. Claude Opus 4.7 führt mit 56 % und baute ein 16.000-Zeilen-Toolkit in 14 Stunden. Relevant für Agenten-Workflows und Code-Review. https:// the-decoder.de/19-tage-ohne-me nsch…