PulseAugur
实时 20:24:57
实体 LLM Meter

LLM Meter

PulseAugur coverage of LLM Meter — every cluster mentioning LLM Meter across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. COMMENTARY · CL_78579 ·

    Claude 6 月可靠性下降,ChatGPT 在 LLM 指数上有所改善

    Anthropic 的 Claude 在 6 月份的可靠性有所下降,两次中断导致其在 LLM 指数上的表现降至 90。与此同时,OpenAI 的 ChatGPT 表现有所提升,在同一指标上达到 86。这凸显了正常运行时间对于 AI 系统日益增长的重要性,尤其是在无人值守的代理越来越多地用于代码执行的情况下。

  2. RESEARCH · CL_50740 ·

    Google的Gemini凭借新的低成本变体引领LLM Meter

    在I/O大会发布公告后,Google的Gemini在LLM Meter中的排名有所提升。一款新的、更经济实惠的Gemini版本现在的表现可与更昂贵的旗舰型号相媲美。这一发展正给Anthropic的Claude等竞争对手带来压力,而OpenAI的ChatGPT则从企业协议中获益。