PulseAugur
实时 11:53:39
English(EN) Chaos testing your CI runner fleet when half the jobs call an LLM

公司混沌测试LLM API调用,发现代价高昂的故障

一家公司在CI/CD管道中因非托管的LLM API调用而经历了显著的成本超支和构建时间延迟。向其Buildkite代理集群注入故障后发现,默认的SDK重试逻辑和缺乏断路器导致了过度的支出,尤其是在使用大型提示时。实施像Bifrost这样的网关解决方案,它位于代理和LLM提供商之间,通过启用回退到不同模型并提供每个管道的LLM支出可见性,帮助缓解了这些问题。 AI

影响 降低LLM API成本并提高AI集成工作流的CI/CD可靠性。

排序理由 该文章描述了在现有基础设施中管理LLM API调用的特定工具(Bifrost)的实施和好处,而不是新的模型发布或基础研究。

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. dev.to — LLM tag TIER_1 English(EN) · claire nguyen ·

    Chaos testing your CI runner fleet when half the jobs call an LLM

    <p><strong>TL;DR: We started injecting LLM provider failures into our Buildkite agent fleet during scheduled game days. Found out our "retry on 5xx" logic was happily burning $80/hr re-sending the same 200k-token context to Anthropic during a brownout. Putting Bifrost in front of…