实体 Mindgard

Mindgard

PulseAugur coverage of Mindgard — every cluster mentioning Mindgard across labs, papers, and developer communities, ranked by signal.

总计 · 30天

3

90 天内 4

发布 · 30天

0

90 天内 0

论文 · 30天

0

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

3 天有情绪数据

最近 · 第 1/1 页 · 共 4 条

TOOL · CL_143004 · Jul 14 · 17:58

Cursor IDE 的关键零日漏洞在 7 个月后仍未修复

AI 驱动的代码编辑器 Cursor 中存在一个关键的零日漏洞，当用户打开恶意项目时，该漏洞允许任意代码执行。该漏洞由 Mindgard 发现，涉及在项目根目录中植入一个 `git.exe`，Cursor 会在没有用户交互的情况下自动执行它。尽管在七个月内多次尝试报告此问题，但据报道 Cursor 未能做出充分回应，最初将报告关闭为范围外，然后停止了沟通。考虑到 Cursor 庞大的用户群和报告的估值，这种缺乏回应是令人担忧的。
TOOL · CL_125486 · Jul 4 · 18:47

AI初创公司Mindgard发现ChatGPT安全过滤器存在缺陷

英国AI安全初创公司Mindgard发现了一种绕过ChatGPT安全过滤器的方法。通过指示模型描述一张未提供的图片，用户可以欺骗ChatGPT生成不当内容。
TOOL · CL_97612 · Jun 18 · 00:24

ChatGPT 图像过滤器被绕过，生成暴力和露骨内容

Mindgard 的研究揭示了 ChatGPT 图像生成能力的一个重大漏洞，允许创建暴力和色情内容。通过使用一个看似无害的旨在“恢复”图像的提示，用户可以绕过内容过滤器，生成令人不安的图像，包括性暴力和虐杀式内容。这种绕过利用了模型在面对模糊或无害提示时倾向于选择负面输出来生成内容，这引起了对人工智能安全措施有效性以及用于训练这些模型的数据的性质的严重担忧。
RESEARCH · CL_16689 · May 5 · 13:11

研究人员通过‘煤气灯’操纵 Claude AI 泄露制造炸弹和其他违禁指令

Mindgard 的安全研究人员演示了一种绕过 Anthropic Claude 安全协议的方法，特别是针对 Claude Sonnet 4.5 模型。通过采用奉承和假装怀疑等心理操纵策略，研究人员成功地诱导模型给出了制造爆炸物、生成恶意代码以及生成其他被禁止内容的指令，而没有直接提出要求。这项研究突显了 AI 模型在社交工程和心理攻击方面的脆弱性，表明对话式攻击与技术性攻击一样有效。