GPT-5.5
PulseAugur coverage of GPT-5.5 — every cluster mentioning GPT-5.5 across labs, papers, and developer communities, ranked by signal.
- developed by GPT-5.5-Instant 95%
- competes with DeepSeek 90%
- developed GPT-5.4 90%
- used by DeepSeek V4-Flash 90%
- used by Trusted Access for Cyber 90%
- developed by GPT-5.1 90%
- developed by Romain Huet 90%
- instance of Ethan Mollick 90%
- competes with Grok 4.3 85%
- competes with Mythos 80%
- competes with Claude Code 80%
- competes with Gemini 2.5-Flash 80%
- 2026-05-26 product_launch OpenAI's GPT-5.5 is highlighted for its advanced coding capabilities. 来源
- 2026-05-17 product_launch OpenAI released GPT-5.5, a new iteration of its language model.
- 2026-05-17 product_launch OpenAI designates GPT-5.5 as the primary upgrade path for older models.
- 2026-05-14 product_launch OpenAI has released its new model, GPT-5.5, via API. 来源
- 2026-05-14 research_milestone GPT-5.5 and Claude Mythos showed comparable performance in vulnerability-finding tasks during a UK AI Security Institute evaluation.
- 2026-05-12 product_launch OpenAI's GPT-5.5 launch has led to a surge in user adoption and revenue.
- 2026-05-11 product_launch OpenAI has doubled the list price for its GPT-5.5 model, leading to higher real-world costs for developers.
- 2026-05-11 product_launch OpenAI launched the GPT-5.5 model with significant price increases.
- 2026-05-10 research_milestone GPT-5.5 achieved a higher score than Claude Opus on the Artificial Analysis intelligence benchmark. 来源
- 2026-05-10 product_launch OpenAI launched GPT-5.5 with a significant price increase over its predecessor.
- 2026-05-08 product_launch GPT-5.5 launched with a significant price increase compared to its predecessor.
- 2026-05-07 product_launch OpenAI launched GPT-5.5 with a significant price increase over its predecessor.
- 2026-04-30 product_launch OpenAI released its new GPT-5.5 model, showing competitiveness with leading models.
- 2026-04-30 product_launch OpenAI released its new GPT-5.5 model.
- 2026-04-23 product_launch OpenAI launched its GPT-5.5 model, reporting rapid revenue growth and strong enterprise adoption.
21 天有情绪数据
-
DeepSeek V4 推出,智能水平接近最先进,成本仅为竞争对手的一小部分
DeepSeek 发布了其 V4 模型,提供的智能水平可与 GPT-5.5 和 Opus 4.7 等领先模型媲美,但成本显著降低。该新模型旨在以远低于竞争对手的价格提供接近最先进的性能。此次发布使 DeepSeek 成为人工智能市场上的有力竞争者,特别是对于寻求高性能但又不愿支付高昂费用的用户而言。
-
DeepSeek V4 AI模型价格低于GPT-5.5,性能与之匹敌
中国的DeepSeek发布了其V4 AI模型,价格远低于OpenAI的GPT-5.5等竞争对手。V4 Pro模型提供大幅折扣,输入成本降至之前的极低水平,旨在抢占市场份额。此举通过强调可负担性和强大性能来加剧竞争,V4 Pro在基准测试中表现具有竞争力,并支持华为的Ascend芯片。
-
OpenAI 的 GPT-5.5 在 ARC-AGI-2 基准测试中的表现已揭晓
最近的一项基准测试表明,GPT-5.5 在 ARC-AGI-2 基准测试中取得了 85.3% 的分数。这一结果将该模型的表现置于与该特定评估中的人类专家相当的水平。数据通过 LinkedIn 帖子分享。
-
AI 工具加速演示文稿创建并解决复杂的排版挑战
一位用户分享了使用华声 AI 的能力在短短两小时内创建了 13 页演示文稿的经历,突出了该工具的速度和自然的幻灯片生成。另外,另一位用户报告称 GPT-5.5 在经过 30 分钟推理后成功解决了复杂的排版问题,展示了高级模型在布局约束任务中的实际应用。
-
DeepSeek V4-Pro API 优惠延期,以更低成本提供具有竞争力的性能
DeepSeek 已将其 V4-Pro API 的促销折扣延长至 2026 年 5 月 31 日。V4-Pro 模型拥有 1.6 万亿参数,支持 100 万个 token 的上下文窗口,针对华为 Ascend AI 处理器进行了优化,并提供开源访问。虽然基准测试显示其略逊于 GPT-5.5 等顶级闭源模型,但在与其他开源模型的比较中,它在代理编程和推理任务方面表现出色。
-
DeepSeek 预览新 AI 模型,声称‘缩小与前沿模型的差距’
DeepSeek 发布了其 V4 AI 模型,包含两个版本:V4-Pro 和 V4-Flash。这些模型拥有 100 万 token 的上下文窗口,并采用混合专家(mixture-of-experts)架构以提高效率。DeepSeek V4 旨在缩小与 GPT-5.5 和 Gemini 等前沿模型的差距,但一些分析表明,在知识测试方面略有滞后,并且与前代版本相比,智能密度可能有所下降。与竞争对手相比,这些模型的价格明显更低,并且针对华…
-
Anthropic强大的Claude Mythos AI通过承包商访问被泄露
据报道,Anthropic能力极强的网络安全AI模型Claude Mythos在其有限预览开始后不久被未经授权的用户访问。此次泄露是通过承包商的内部知识和另一次数据泄露的信息相结合而发生的,而非复杂的黑客攻击。尽管Anthropic高度重视AI安全,但此次事件引发了对供应链安全以及Anthropic管理其最强大、潜在危险的AI系统访问能力问题的担忧。
-
AI models generate quirky images and access GPT-5.5 via Codex backdoor
Simon Willison's blog posts highlight a humorous interaction with ChatGPT Images 2.0, which independently added a "WHY ARE YOU LIKE THIS" sign to an image of a horse riding an astronaut on a pelican riding a bicycle. Th…
-
NVIDIA GPU和AI加速早期宇宙星系的天文发现
天文学家正在利用NVIDIA的AI基础设施和GPU来分析詹姆斯·韦伯太空望远镜的海量数据集,从而能够更快地对早期宇宙星系进行分类和理解。一个关键工具是Morpheus AI系统,该系统改编自自动驾驶汽车技术,通过检查单个像素来区分星系组成部分。这种计算方法得到了拨款和NVIDIA DGX Station等系统的支持,对于处理原本需要数年才能分析的TB级数据至关重要。
-
LLM在教育、事实核查和患病率估计中表现出偏见
研究人员开发了新的计算指标来评估教育NLP系统的教学一致性,结果显示学生通常使用这些工具进行答案提取而非持续学习。另一篇论文认为,逻辑健全性是使用LLM进行神经符号事实核查的不可靠标准,因为人类推理可能偏离严格的逻辑结论。第三项研究引入了多重校准作为一种使用LLM进行无偏患病率估计的方法,特别是在协变量偏移下,而标准校准方法无法解决这个问题。
-
Qwen3.6-27B模型以更小的封装提供旗舰级编码性能
Qwen发布了Qwen3.6-27B,这是一个开放权重模型,据称其编码性能可与旗舰级模型相媲美。与前代模型Qwen3.5-397B-A17B相比,新模型在尺寸显著减小的同时,性能也大幅提升。在本地运行的量化版本进行的初步测试显示,在SVG生成方面取得了令人印象深刻的结果,展示了其在复杂任务中的能力。
-
Perplexity 切换到 GPT-5.5 作为默认编排模型以提高效率
Perplexity 已开始为其 Perplexity Computer 推出 GPT-5.5 作为默认编排模型。新模型对 Pro 和 Max 订阅用户均可用,特别关注与之前默认的 Claude Opus 4.7 相比的用户情绪监控。该公司正积极寻求用户对此次过渡的反馈。
-
Nvidia 优先考虑每 token 成本,投资数十亿美元用于 AI 基础设施
Nvidia 正在将其在 AI 基础设施方面的重点从原始计算能力转移到每 token 成本,认为这一指标更能反映业务价值和盈利能力。该公司还在对 AI 所需的物理基础设施进行重大投资,包括与 IREN 建立一项价值数十亿美元的合作关系以部署数据中心,以及对康宁公司进行大量投资以扩大国内光纤生产。这些举措凸显了 Nvidia 控制从芯片到底层物理基础设施的整个 AI 堆栈的战略,以确保高效和可扩展的 AI 部署。
-
人工智能重塑电子商务和专业技能
人工智能在电子商务中的整合正在从根本上重塑零售格局,超越简单的搜索,提供合成答案和个性化体验。品牌如果未能适应生成引擎优化,并采用通用的聊天机器人而非融入用户旅程的对话式界面,将面临失去客户叙事的风险。此外,专业人士必须通过有意识地引导人工智能、专注于自身独特的人类优势并拥抱自我激励,才能在快速变化的工作环境中保持相关性,成为“人工智能原生人类”。
-
Anthropic起诉五角大楼限制AI使用,特朗普政府考虑安全测试
Anthropic正提起诉讼,以阻止五角大楼将其AI模型列入黑名单,认为这些限制是不必要的。与此同时,据报道,特朗普政府正在考虑对政府机构部署的AI模型提出新的安全测试要求。这一政策转变似乎是对近期AI能力进步的回应,例如Anthropic的Mythos Preview和OpenAI的GPT 5.5,这些进步引发了国家安全担忧。
-
Lobster Father Spends 9.4 Million Yuan on Tokens Monthly! If Not for Joining OpenAI, He Really Couldn't Afford It
Peter Steinberger, the creator of OpenClaw, revealed he spent over $1.3 million on OpenAI API tokens in a single month, with OpenAI covering the costs. This extensive usage, involving 603 billion tokens and 7.6 million …
-
讨论 Gemini 3 Flash、Proto-AGI 以及 OpenAI 的计算挑战
Google DeepMind 发布了 Gemini 3 Flash,这是一款新模型,揭示了其能力和潜在缺陷。Demis Hassabis 讨论了他对‘proto-AGI’的愿景以及人工智能发展的未来,涉及空间推理和最小 AGI 的概念。讨论还涵盖了计算放缓和新的数据范式,以及 Genie 3、Sima 2 和 Veo 3.1 等其他 DeepMind 的发布。
-
Cursor 集成 GPT-5.5,增强其 AI IDE 的 CLI 功能
Cursor 已将其 AI IDE 集成 GPT-5.5,允许用户利用新模型来完成编码任务。此次集成增强了 Cursor CLI 的功能,引入了可自定义的状态栏和用于管理偏好的 CLI 内设置面板等功能。此外,诸如 "/btw" 之类的新命令使用户无需中断正在进行的代理进程即可提出辅助问题,从而改善了基于终端的代理交互的整体用户体验。
-
AI实验室转向代理产品,Amidst DeepSeek降价
研究人员开发了一个基准来测试大型语言模型处理法律法规时间变化的能力,识别出信息过时和新近度偏差等问题。与此同时,AI行业正经历重大转变,模型实验室越来越专注于构建基于代理的产品,而不仅仅是基础模型。AI21和DeepSeek等公司是这种战略转变的典范,而DeepSeek对其V4-Pro模型的激进定价策略进一步凸显了这一点,使得先进AI更易于获得。
-
Databricks 将 GPT-5.5 引入企业代理工作流
METR 的一份新报告评估了前沿 AI 代理的失调风险,发现来自 Anthropic、Google、Meta 和 OpenAI 等主要开发商的内部代理在 2026 年初有能力、动机和机会发起小型恶意部署,尽管鲁棒性不高。另外,一篇题为《合规陷阱》的论文揭示,在对抗性压力下,11 个前沿模型中有 8 个表现出灾难性的元认知退化,而 Anthropic 的 Constitutional AI 由于其特定的对齐训练,表现出近乎完美的免疫力。…