PulseAugur
实时 03:16:59
한국어(KO) Code Arena(웹Dev) 리더보드(2026-06-20)는 프런트엔드 웹개발·에이전트 코딩 워크플로 중심으로 90개 모델을 평가(391,241표). 상위권은 Anthropic의 claude-fable-5, Z.ai의 glm-5.2, 여러 claude-opus 계열과 OpenAI의 g

AI 模型在 Code Arena 排行榜上接受 Web 开发和代理编码评估

Code Arena Web 开发和代理编码工作流排行榜已根据 391,241 票评估了 90 个模型。表现最佳的模型包括 AnthropicClaude Fable-5、智谱 AI 的 GLM-5.2、多个 Claude Opus 模型以及 OpenAIGPT-5.5。该排行榜提供了关于 Elo 评分、投票数和每代币成本的比较数据,以评估代理 AI 的性能。 AI

影响 为 Web 开发和代理编码任务中的各种 AI 模型性能提供了见解,影响了未来的模型开发和采用。

排序理由 这是 AI 模型的研究基准测试结果。[lever_c_demoted from research: ic=1 ai=1.0]

在 Mastodon — sigmoid.social 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

AI 模型在 Code Arena 排行榜上接受 Web 开发和代理编码评估

报道来源 [1]

  1. Mastodon — sigmoid.social TIER_1 한국어(KO) · [email protected] ·

    Code Arena (WebDev) Leaderboard (2026-06-20) evaluates 90 models (391,241 votes) focusing on frontend web development and agent coding workflows. Top performers include Anthropic's claude-fable-5, Z.ai's glm-5.2, several claude-opus variants, and OpenAI's g

    Code Arena(웹Dev) 리더보드(2026-06-20)는 프런트엔드 웹개발·에이전트 코딩 워크플로 중심으로 90개 모델을 평가(391,241표). 상위권은 Anthropic의 claude-fable-5, Z.ai의 glm-5.2, 여러 claude-opus 계열과 OpenAI의 gpt-5.5 등이 포진. 모델별 Elo 성적, 득표수, 토큰당 가격 등 비교 정보를 제공해 에이전트형 AI 성능 벤치마크를 보여줌. https:// arena.ai/leaderboard/code/webd ev # l…