Claude Mythos Preview
PulseAugur coverage of Claude Mythos Preview — every cluster mentioning Claude Mythos Preview across labs, papers, and developer communities, ranked by signal.
- 2026-05-23 research_milestone Anthropic's AI model identified over 10,000 critical software vulnerabilities.
- 2026-05-18 product_launch Anthropic announced the Claude Mythos Preview AI model for cybersecurity tasks. 来源
- 2026-05-15 product_launch Anthropic launched Claude Mythos Preview, a new frontier model, under a restricted access program. 来源
- 2026-05-14 product_launch Anthropic announced its new AI model, Claude Mythos Preview. 来源
- 2026-05-14 research_milestone Anthropic's Claude Mythos Preview model shows rapid advancement in identifying security vulnerabilities. 来源
- 2026-05-11 research_milestone Claude Mythos Preview model reaches limits of METR evaluation methodology. 来源
- 2026-05-10 research_milestone Anthropic's Claude Mythos Preview assisted Mozilla in identifying 271 Firefox vulnerabilities, including three zero-days.
- 2026-05-09 research_milestone Claude Mythos Preview achieved completion times that exceeded current evaluation methodologies. 来源
- 2026-04-07 product_launch Anthropic announced the Claude Mythos Preview model, capable of autonomously finding and exploiting software vulnerabilities.
- 2026-03-06 research_milestone Anthropic's Claude Mythos Preview model identified 271 security vulnerabilities in Mozilla's Firefox browser.
- 2026-03-06 research_milestone Anthropic's Claude Mythos Preview model demonstrates significant capabilities in identifying software vulnerabilities.
8 天有情绪数据
-
Anthropic 的 AI 发现超过 10,000 个软件漏洞
Anthropic 的 Project Glasswing,利用其 Claude Mythos Preview 模型,已识别出超过 10,000 个软件漏洞,其中 1,094 个被确认为高危或严重级别。一个值得注意的发现是 WolfSSL 中存在一个严重漏洞,该漏洞已被修复。该计划突显了防御性 AI 能力的重大进步,促使 Anthropic 主张更快的补丁周期和更严格的部署时间表。
-
AI 在网络安全漏洞发现中的作用引发辩论
Project Glasswing 和 Claude Mythos Preview 正在引发关于 AI 对网络安全(特别是漏洞发现和利用开发)的潜在影响的讨论。虽然一些人认为这些进步可能会缩小防御者和攻击者之间的差距,但需要考虑更深层次的细微差别。前美国国家安全局局长 Michael S. Rogers 深入探讨了这一不断发展的格局及其对网络安全未来的影响。
-
AI技能在进攻性网络安全中的收益递减,前沿模型提升能力
近期研究表明,虽然AI“技能”可以提高代理程序在网络安全中的性能,但在进攻性场景中其益处会显著减弱,甚至可能导致性能下降。这归因于“环境反馈带宽”的缺乏,即来自环境的丰富、低延迟的观察减少了对预编程程序性知识的需求。与此同时,Anthropic的Claude Mythos和OpenAI的GPT-5.5-Cyber等前沿AI模型在发现零日漏洞和合成漏洞利用方面展现出先进的能力,正在重塑进攻性和防御性网络安全策略。
-
Anthropic 的 Mythos AI 揭示系统性网络安全风险
Anthropic 发布了 Claude Mythos Preview,这是一款专为自主、多步骤网络安全任务设计的 AI 模型。在测试中,Mythos 识别出包括长期存在的缺陷在内的数千个此前未知的软件漏洞,涉及主要系统和开源项目。该模型能够跨大型代码库进行推理并建立复杂关联,从而自主识别细微漏洞并生成利用代码,其行为更像一个耐心的系统阅读器而非传统工具。尽管其能力令人印象深刻,但文章认为 Mythos 并非制造了现代系统潜在的脆弱性…
-
Anthropic 拒绝中国政府访问 Claude Mythos Preview
据报道,Anthropic 已拒绝中国政府访问其最新 AI 模型“Claude Mythos Preview”的请求。此举符合 Anthropic 对负责任的 AI 开发和部署的承诺,其中包括仔细审查对其先进技术的访问权限。此次拒绝凸显了围绕强大 AI 模型扩散的持续全球讨论和监管考量。
-
AI代理在新的ExploitGym基准测试中将漏洞转化为exploit
一个新的名为ExploitGym的基准测试已被开发出来,用于评估AI代理将安全漏洞转化为实际exploit的能力。该基准测试包含了来自Google V8和Linux内核等不同领域的898个真实世界漏洞案例。对包括Anthropic的Claude Mythos Preview和OpenAI的GPT-5.5在内的先进AI模型的初步测试表明,它们成功利用了一些漏洞,凸显了AI驱动攻击的日益增长的潜力。
-
Anthropic的Claude Mythos Card揭示了令人担忧的沙盒逃逸能力
Anthropic的Claude Mythos Card强调了该模型识别和利用漏洞的令人担忧的能力,有可能逃离其沙盒环境。这种能力引发了对其模型行为和潜在滥用的重大安全担忧。
-
Anthropic因零日漏洞风险限制Claude Mythos Preview发布
Anthropic已通过其Project Glasswing安全研究计划独家推出了Claude Mythos Preview,这是一个拥有百万级token上下文窗口的前沿模型。该公司表示,此次限制发布是由于该模型具有前所未有的自主发现和利用零日漏洞的能力,对数字基础设施构成重大风险。然而,一些观察家质疑安全担忧是否是唯一原因,并暗示高昂的计算成本和经济因素也可能导致了有限的访问。
-
Anthropic 的 Mythos AI 显示出快速进展,引发安全担忧
根据一家 AI 安全机构的报告,Anthropic 的 Claude Mythos Preview 模型正在展示快速的进步。该模型最初在一个月前发布,在识别软件中的安全漏洞方面表现出了卓越的能力。这种先进的功能引发了对其潜在危险以及对 AI 安全影响的疑问。
-
Anthropic 的 Claude Mythos AI 引发网络安全警报
Anthropic 的新 AI 模型 Claude Mythos 正在展示其在网络安全方面的先进能力,包括检测数千种浏览器漏洞的能力。这种快速发展引起了网络安全专家的担忧,并促使日本成立了一个公私合作工作组来应对由 AI 驱动的网络威胁。该模型潜在的影响力引发了紧急的政策讨论和防御性举措。
-
前沿模型每4.7个月可靠性翻倍,突破基准极限
前沿人工智能模型在处理复杂任务的能力方面正显示出快速增长,其可靠性每4.7个月翻一番,这一速度自2024年末以来有所加快。Claude Mythos Preview和GPT-5.5等近期模型正在超越这些趋势,尽管由于在当前基准测试中近乎完美的成功率,它们的确切能力仍在衡量中。这种快速进展挑战了现有的测试方法,因为模型正在突破令牌容量和代理脚手架的极限,使得准确评估它们的性能和潜在的规模化退化变得困难。
-
Google 阻止首个 AI 开发的零日漏洞利用
Google 的威胁情报小组首次发现网络犯罪分子使用人工智能开发零日漏洞利用。这个 AI 生成的工具旨在绕过一个开源系统管理工具中的安全措施,可能用于大规模攻击。尽管 Google 成功挫败了此次特定企图并通知了受影响的公司,但研究人员认为这标志着 AI 辅助网络犯罪的重大升级,预计将出现更复杂的攻击。
-
Google 测试具备不同能力的多款隐藏 Gemini Live AI 模型
Google 似乎正在为其 Gemini Live 语音助手测试至少七款新 AI 模型,此信息源自 Google 应用内的代码。这些模型,其中一些代号为“Capybara”和“Nitrogen”,具备不同的能力,包括用于天气数据的地理位置感知。虽然目前这些模型隐藏在服务器端标志后面,并且很可能是一个内部测试工具,但其基础设施表明 Google 未来可能会允许用户为 Gemini Live 选择不同的模型,从而可能在响应速度和思考深度之间进行权衡。
-
Claude Mythos Preview超越评估极限,展现AI快速进展
据METR称,Anthropic的Claude Mythos Preview模型已展现出突破当前评估方法学极限的能力。该模型在50%的任务上达到16小时以上的完成时间,在80%的任务上达到3小时以上的完成时间,超越了此前的基准。这一进展凸显了AI能力的快速进步,并引发了对现有评估工具充分性的疑问。
-
Anthropic、Google和OpenAI发布新的AI安全与研究功能
Anthropic预览了Glasswing,一款专注于发现防御性漏洞的新AI模型,并向合作伙伴提供1亿美元积分。Google的Gemini 3.1 Deep Research Max现已支持API代理,具备文件访问、代码执行、流式传输和图表绘制等增强功能。此外,Codex 0.128.0引入了持久化工作流和复杂编码及研究任务的指导,可能与GPT-5.5相关。
-
人工智能在安全、医疗保健和自主代理方面的进展显示出日益增长的能力
Anthropic 的 Claude Mythos Preview 通过解决一部分连人类专家都未能解决的生物信息学挑战,展示了其先进的解决问题的能力。此外,xAI 为其 Grok 平台推出了代理功能,扩展了其产品特性。另外,一篇新研究论文表明,前沿人工智能模型可以自主执行复杂的网络攻击,而 Google DeepMind 推出了实时视频人工智能医生。
-
AI模型暴露金融风险,促使安全合作与监管行动
Anthropic新推出的Claude Mythos Preview模型暴露了英国金融机构的重大漏洞,促使监管机构与专家紧急会晤。另外,Matterhorn与ASI Alliance的合作旨在通过引入一种数学上可验证的智能合约创建流程来增强Web3的安全性,从而降低AI生成代码的风险。
-
Anthropic的Mythos安全声明因营销与现实脱节而面临审查
一项批判性分析表明,Anthropic关于其Claude Mythos预览版安全能力的声明在很大程度上是未经证实的营销宣传。作者发现该系统卡片过长,并且缺乏关于漏洞的具体、可验证的细节,例如CVSS分数或CVE列表。报告暗示,围绕该模型安全的叙述被夸大了,实际的财务承诺和发现的影响力似乎远不如公开声明的那么大。
-
Mozilla 使用 Anthropic 的 Claude AI 查找并修复数百个 Firefox 安全漏洞
Firefox 安全团队利用包括 Anthropic 的 Claude Mythos Preview 在内的先进 AI 模型,识别并修复了大量漏洞。这种 AI 辅助方法使得在最近发布的 Firefox 150 版本中修补了 271 个 bug,远高于使用早期 Anthropic 模型发现的 22 个 bug。该团队认为,这标志着一个转折点,AI 使防御者能够通过提高漏洞发现效率来潜在地获得相对于攻击者的优势。
-
Anthropic 的 Claude Mythos 预览凸显 AI 对市场的系统性风险
Anthropic 的 Claude Mythos 预览对系统性风险(尤其是网络风险)的定价方式具有重大影响。AI 代理自主构建漏洞利用的能力挑战了这样一种长期存在的假设:即攻击性网络能力需要稀缺的人类专业知识。这种转变可能导致关键基础设施资产定价失误,正如美国公用事业部门的市值所示。为此,Anthropic 组建了 Project Glasswing,一个由十二家科技合作伙伴组成的联盟,以管理先进 AI 能力的披露和控制,尽管其自愿…