实体 Gemini 1 5

Gemini 1 5

PulseAugur coverage of Gemini 1 5 — every cluster mentioning Gemini 1 5 across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 9

发布 · 30天

90 天内 0

论文 · 30天

90 天内 4

层级分布 · 90 天

research 2
tool 4
commentary 3

主题

时间线

2026-05-20 product_launch Google launched its Gemini 1.5 series of AI models.

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 9 条

COMMENTARY · CL_85457 · Jun 11 · 08:43

AI发展时间线显示GPT-5、Claude 4将于2025年发布

该图描绘了AI发展的时间线，从2023年GPT-4和Claude 2等模型的发布开始。它进展到2024年，重点介绍了GPT-4.5、Claude 3和Gemini 1.5等进步。时间线预测到2025年将发布GPT-5和Claude 4等模型，并进一步延伸到2026年，预测GPT-6和Claude 5等模型。
COMMENTARY · CL_53426 · May 27 · 01:46

AI视频生成：LoRA训练对比深度图以实现一致性

一位Reddit用户正在寻求有关使用更便宜的模型来提高AI生成的产品摄影视频一致性的建议。他们正在比较两种潜在方法：训练LoRA模型或使用更准确的灰度深度图参考视频。目标是实现更好的物体一致性，尤其是在物体旋转期间，而当前的Seedance 1.5、Grok Imagine或WAN 2.2等较便宜的模型在这方面效果不佳。
TOOL · CL_44506 · May 22 · 15:25

专门的30亿参数AI模型在OCR任务上表现优于前沿API

一个专门的30亿参数AI模型在结构化OCR任务上表现优于领先的商用前沿API，证明了领域特定的微调可以超越单纯的模型规模。该专用模型在运营成本上也显著更低，挑战了长期以来默认选择最大可用模型的采购策略。研究结果表明，对于特定的企业应用，定制化的小型模型比通用大型模型提供了更具成本效益和更高性能的解决方案。
SIGNIFICANT · CL_40264 · May 20 · 07:13

Google发布Gemini 1.5，回应AI对话泄露问题

Google发布了其Gemini 1.5系列模型，标志着其AI能力取得重大进展。该公司还在解决用户对AI技术潜在“对话泄露”的担忧。与此同时，长鑫科技是商络电子的关键合作伙伴，但商络电子不持有该公司任何股权。
TOOL · CL_18789 · May 6 · 04:00

新的MSI指标揭示了大型语言模型中细微的偏见，蒸馏过程会重新引入偏见

研究人员开发了一种新的指标——道德敏感性指数（MSI），用于评估大型语言模型中的上下文偏见。该指数通过七层压力测试量化了偏见输出的概率，超越了简单的二元分类。对Claude 3.5、Qwen 3.5、Llama 3和Gemini 1.5等模型的评估揭示了受其对齐设计影响的不同行为模式，其中Gemini 1.5在社会经济框架下表现出显著偏见，而Claude则表现出急剧的抑制。对犯罪偏见情景的机制分析证实了这些行为发现，表明推理蒸馏可能会…
RESEARCH · CL_18669 · May 5 · 16:36

UnAC方法通过自适应提示增强LMM的复杂多模态推理能力

研究人员推出了一种新颖的多模态提示方法UnAC，旨在增强大型多模态模型（LMM）在复杂视觉任务上的推理能力。该方法采用自适应视觉提示来帮助模型聚焦于相关图像区域，并使用图像抽象提示来提取关键信息。此外，UnAC还包含一个渐进式自我检查机制，用于验证分解的子问题的答案，从而提高整体推理准确性。
RESEARCH · CL_13057 · May 2 · 13:46

GPT-5.5 和 Opus 4.7 在 ARC-AGI-3 基准测试中显示出系统性推理失败

一项新的基准测试 ARC-AGI-3 揭示了 GPT-5.5 和 Opus 4.7 等先进 AI 模型存在严重的推理错误。这些模型在该基准测试上的成功率仅为 0.8%，凸显了在抽象推理能力方面持续存在的差距。研究结果表明，尽管技术取得了进步，但当前的 AI 系统在基本的人类水平任务方面仍面临困难。
TOOL · CL_17686 · Oct 28 · 14:13

LLM在“传递黄油”机器人测试中失败，得分远低于人类表现

一项名为Butter-Bench的新评估显示，当前最先进的大型语言模型在控制机器人执行实际任务方面存在显著困难。在旨在评估它们执行诸如传递黄油等家务的能力的测试中，表现最好的LLM仅达到40%的完成率，远低于人类95%的成功率。Gemini 2.5 Pro和Claude Opus 4.1等模型在空间意识和任务执行方面显示出局限性，突显了LLM推理能力与现实世界机器人应用之间的差距。
COMMENTARY · CL_118755 · Oct 15 · 18:04

《AI 现状》报告发现，随着推理成本暴跌，OpenAI 的 AI 领先优势正在被侵蚀

Nathan Benaich 的年度《AI 现状》报告表明，OpenAI 在人工智能领域的竞争优势已显著减弱，来自 Anthropic、Google、X 和 Meta 等竞争对手的模型在多项基准测试中已能媲美甚至超越 GPT-4o。报告还强调，在竞争加剧和工程优化推动下，AI 推理成本迅速下降，使得 AI 解决方案在经济上对企业更具可行性。此外，报告指出机器人技术正在复苏，通过整合 LLM 和世界模型来增强机器人能力和部署。

AI发展时间线显示GPT-5、Claude 4将于2025年发布

AI视频生成：LoRA训练对比深度图以实现一致性

专门的30亿参数AI模型在OCR任务上表现优于前沿API

Google发布Gemini 1.5，回应AI对话泄露问题

新的MSI指标揭示了大型语言模型中细微的偏见，蒸馏过程会重新引入偏见

UnAC方法通过自适应提示增强LMM的复杂多模态推理能力

GPT-5.5 和 Opus 4.7 在 ARC-AGI-3 基准测试中显示出系统性推理失败

LLM在“传递黄油”机器人测试中失败，得分远低于人类表现

《AI 现状》报告发现，随着推理成本暴跌，OpenAI 的 AI 领先优势正在被侵蚀