作者对几款大型语言模型的表现表示失望,认为与Anthropic的Claude相比,大多数模型都表现不佳。具体来说,Mistral、Deepseek和Qwen被提及未能达到预期,仅在不需要LLM的琐碎任务上表现尚可。作者还指出,出于道德考量,故意排除了Microsoft Gemini、Grok和OpenAI Codex。 AI
影响 凸显了领先LLM与其竞争对手之间感知到的性能差距,可能影响用户选择和开发者关注点。
排序理由 作者的评论文章,比较了LLM的性能。
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →