PulseAugur
实时 14:55:58
实体 Gemini 1.5 Pro

Gemini 1.5 Pro

PulseAugur coverage of Gemini 1.5 Pro — every cluster mentioning Gemini 1.5 Pro across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
21
90 天内 21
发布 · 30天
0
90 天内 0
论文 · 30天
16
90 天内 16
层级分布 · 90 天
关系
情绪 · 30 天

5 天有情绪数据

最近 · 第 2/2 页 · 共 21 条
  1. RESEARCH · CL_00387 ·

    Google 和 OpenAI 在 AI 的事实性、多语言能力和安全性方面取得进展

    Google DeepMind 推出了 FACTS Benchmark Suite,这是一套新的评估方法,旨在系统地评估大型语言模型在各种用例中的事实性。该套件包括参数知识、基于搜索的信息检索和多模态理解的基准测试,以及更新的 grounding benchmark。该计划旨在提供更全面的 LLM 准确性衡量标准,并将在 Kaggle 上发布公开排行榜,以跟踪领先模型的进展。