English(EN) We Tested 30 LLM APIs with 150 Real Calls — 42.7% Failed (And Why That's Good News)

LLM API 测试显示 4% 失败率，GitHub 模型不稳定

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-19 14:53

最近对 30 个 LLM API 的测试显示失败率为 42.7%，尽管大多数是由于模型弃用或速率限制。当考虑到速率限制等基础设施问题时，实际失败率接近 4%，与行业报告一致。该研究强调了托管在 GitHub 上的模型存在严重的不稳定性，其中几个模型已被弃用或频繁达到速率限制，这使得在生产环境中使用需要有备用策略。NeuralBridge 的 SDK 证明了可恢复故障 100% 的自愈率，可能节省大量能源并减少碳排放。 AI

影响强调了 LLM API 关键基础设施的不稳定性，影响了生产部署，并暗示了对自愈解决方案的需求。

排序理由该集群报告了一项关于 LLM API 性能和可靠性的独立测试和分析。[lever_c_demoted from research: ic=1 ai=1.0]

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

dev.to — LLM tag TIER_1 English(EN) · Eastern Dev · 2026-05-19 14:53

我们用150次真实调用测试了30个LLM API — 42.7%失败（而这其实是好消息）

On May 19, 2026, we ran a simple test: ask 30 different LLM models "What is 2+3?" — 5 times each. 150 real API calls, zero simulation, zero fabrication. The raw result? 86 succeeded, 64 failed. A 42.7% failure rate. But that headline number is misleading. Here's …

报道来源 [1]

我们用150次真实调用测试了30个LLM API — 42.7%失败（而这其实是好消息）

相关实体

相关话题