实体 Gemini 1.5 Pro

Gemini 1.5 Pro

PulseAugur coverage of Gemini 1.5 Pro — every cluster mentioning Gemini 1.5 Pro across labs, papers, and developer communities, ranked by signal.

总计 · 30天

21

90 天内 21

发布 · 30天

0

90 天内 0

论文 · 30天

16

90 天内 16

层级分布 · 90 天

significant 1
research 5
tool 14
commentary 1

关系

情绪 · 30 天

5 天有情绪数据

最近 · 第 2/2 页 · 共 21 条

RESEARCH · CL_00387 · Nov 27 · 16:11

Google 和 OpenAI 在 AI 的事实性、多语言能力和安全性方面取得进展

Google DeepMind 推出了 FACTS Benchmark Suite，这是一套新的评估方法，旨在系统地评估大型语言模型在各种用例中的事实性。该套件包括参数知识、基于搜索的信息检索和多模态理解的基准测试，以及更新的 grounding benchmark。该计划旨在提供更全面的 LLM 准确性衡量标准，并将在 Kaggle 上发布公开排行榜，以跟踪领先模型的进展。