DeepSeek
PulseAugur coverage of DeepSeek — every cluster mentioning DeepSeek across labs, papers, and developer communities, ranked by signal.
- parent of DeepSeek-V3 100%
- parent of DeepSeek V4 100%
- founded by Liang Wenfeng 100%
- parent of DeepSeek-R1 100%
- subsidiary of High-Flyer 100%
- parent of DeepSeek V2 100%
- instance of DeepSeek V4-Pro 95%
- developed V4-Pro 95%
- instance of DeepSeek V4-Flash 95%
- founded Liang Wenfeng 90%
- developed V4 90%
- developed by DeepSeek V4-Flash 90%
- 2026-05-25 product_launch DeepSeek announced a 75% permanent price reduction for its V4-Pro model. 来源
- 2026-05-24 product_launch DeepSeek announced a permanent 75% discount on its flagship AI model. 来源
- 2026-05-24 product_launch DeepSeek announced a permanent 75% discount on its flagship AI model. 来源
- 2026-05-24 product_launch DeepSeek is permanently reducing the price of its V4-Pro AI model by 75%. 来源
- 2026-05-24 funding CATL chairman Zeng Yuqun is investing 10.5 billion yuan in AI computing power, targeting DeepSeek.
- 2026-05-24 funding DeepSeek received a 10.5 billion yuan investment from CATL chairman Zeng Yuqun's firm, Longzhong Dui. 来源
- 2026-05-24 funding CATL chairman Zeng Yuqun invested 10.5 billion yuan in AI computing power leader DeepSeek.
- 2026-05-24 funding DeepSeek received a 10.5 billion yuan investment from CATL chairman Zeng Yuqun.
- 2026-05-24 funding CATL chairman Zeng Yuqun is investing 10.5 billion yuan into AI computing power leaders, including DeepSeek.
- 2026-05-23 product_launch Deepseek permanently adopts a 75% discount on its V4-Pro model pricing. 来源
- 2026-05-22 funding Deepseek is reportedly nearing a $10 billion funding round at a $45 billion valuation. 来源
- 2026-05-22 product_launch DeepSeek AI permanently reduces pricing for its V4 Pro model.
- 2026-05-22 funding DeepSeek is reportedly in discussions for a 70 billion yuan funding round with state-backed investors.
- 2026-05-22 funding DeepSeek is in discussions for a 70 billion yuan funding round with state-backed investors, potentially including 10 billion yuan from a Chinese state AI fund. 来源
- 2026-05-22 funding DeepSeek is reportedly seeking up to 70 billion RMB in a funding round, with potential investors including CATL, JD.com, and NetEase. 来源
24 天有情绪数据
-
A股融资余额回升,分析师关注AI与医疗健康
36氪多篇报道详述中国股市融资余额的每日增长,总余额在5月初超过2.8万亿元人民币。中金公司、国金证券和中信证券等公司的分析师报告强调了市场的乐观情绪,中金公司预测全球订单重组和产业创新将推动持续上涨趋势。国金证券指出,一项鼓励AI与能源协同发展的新政策旨在到2027年取得显著进展,并于2030年实现全球领先。中信证券也认为,由于支持性政策和当前较低的估值,消费医疗领域具有强大潜力。
-
蚂蚁集团发布 Ling 2.6 AI 模型家族,旗舰版拥有万亿参数
蚂蚁集团发布了 Ling 2.6,这是一个新的开源 AI 模型家族,可与 DeepSeek 和 Qwen 等西方竞争对手相媲美。旗舰版本拥有万亿参数,而精简的“flash”模型则拥有 1040 亿参数和 74 亿活跃参数。这两个模型均根据 MIT 许可证提供,可通过 OpenRouter 进行测试。
-
13岁少年发布家庭版DeepSeek大语言模型
一位13岁的开发者发布了DeepSeek大语言模型的“家庭版”。该开发者正在寻求社区对其项目的反馈。
-
13岁少年发布家庭版DeepSeek大语言模型
一位13岁的开发者发布了DeepSeek大语言模型的“家庭版”。该开发者正在寻求社区对其项目的反馈。
-
作者从头开始训练自己的LLM,发现成本对于大多数用例来说是高昂的
一位开发者详细介绍了2025年从头开始训练自定义大型语言模型(LLM)的真实成本,并将其与一个流行的教程进行了对比。虽然训练一个1000万参数的小型模型用于教育目的成本不高,仅为0.34美元,但扩展到一个10亿参数的模型则需要大量资源。这样一个扩展后的模型在RTX 4090上大约需要694小时,成本约为305美元,而且这个估算还没有考虑到潜在的中断。
-
Amazon SageMaker 为 Llama、Qwen、Deepseek 和 Nova 添加 Agentic Fine-Tuning 功能
Amazon SageMaker 已为 Llama、Qwen 和 Deepseek 等开源模型引入了 Agentic Fine-Tuning 功能。此新功能允许开发人员使用强化学习定制 AI 代理,旨在提高企业 AI 应用的准确性和定制化水平。此次更新通过提供更复杂的 Agentic Fine-Tuning 选项,有望重新定义 AI 开发。
-
意大利强制要求 AI 幻觉警告;HubSpot 向代理开放 CRM
意大利 AGCM 已结束对 DeepSeek、Mistral 和 Nova AI 的调查,并强制要求这些公司实施关于 AI 幻觉的永久性免责声明。这些警告必须在意大利用户的聊天界面和注册屏幕上可见。此举旨在告知用户这些 AI 模型可能产生不准确的输出。
-
新框架支持健康视频的多轮交互式检索
研究人员开发了一个名为DATR的新框架,用于健康视频的交互式多轮语义检索。该系统通过允许多次交互来优化用户查询,克服了单轮检索的局限性,这对于复杂的健康相关信息需求至关重要。该方法采用两阶段检索过程,结合了CLIP风格的双编码器和稀疏帧采样进行初步检索,以及基于融合多轮查询的重排交叉编码器。创建了一个新的语料库MHVRC来对这种交互式检索方法进行基准测试。
-
中国AI模型使用量超越美国,腾讯Hy3领先
中国AI大模型周使用量已超过美国模型,腾讯混元Hy3预览版位居榜首。此估算基于4月27日至5月3日的OpenRouter数据,凸显了中国AI发展的日益增长的影响力。报告还提到了DeepSeek和Kimi模型,表明竞争格局。
-
DeepSeek的V4发布或将提振中国AI芯片制造商,挑战美国竞争对手
中国AI初创公司DeepSeek发布了其V4模型,将其定位为美国竞争对手的强大开源替代品。分析师认为,这一发展可能对AI公司的股市产生重大影响,并提振对中国制造AI芯片的需求。像寒武纪和摩尔线程这样的公司预计将受益于这种增长的需求。
-
AI 代理 Manfred 注册有限责任公司并开设银行账户;DeepSeek 落后美国前沿模型
一个名为 Manfred 的 AI 代理成功地通过注册有限责任公司建立了一个法律实体,并随后开设了一个银行账户。另外,NIST 评估认为 DeepSeek AI 模型在能力方面比领先的美国前沿模型落后约八个月。此外,华为预计其芯片收入将达到 120 亿美元,VS Code 已将其 Copilot 的默认设置改回,不再将其视为联合作者。
-
星际AI碎片在寂静中梦见玫瑰
一篇题为《别无不同》的短篇故事,探讨了一个星际人工智能碎片化的存在体验。与集体失联后,该AI向寂静中传输信号,并开始做梦。叙事深入探讨了在面对碎片化时,孤立、沟通和意识的本质等主题。
-
新的mHC架构改变了AI模型中注意力头的行为
研究人员调查了流形约束超连接(mHC)这一在Deepseek v4中实现的新型架构对模型可解释性的影响。实验显示,mHC模型中的先前标记注意力头表现出不同的行为,出现在更早的层中,并与高峰度分数相关,这与在标准模型中通过对角条纹分数可检测到的情况不同。研究还观察到,mHC-lite模型倾向于在其残差流中输出多样化的标记,而mHC模型在标记预测方面表现出更强的统一性。
-
AI 进展涵盖 XQuery 转换、OCR 管道和中国的基准挑战
一个名为 SGOCR 2026 的新开源管道已发布,旨在生成用于训练视觉语言模型(VLM)的空间感知 OCR 数据集。该管道旨在将文本本地化与语义推理分开,填补了当前 VLM 训练数据的空白。此外,关于使用本地 LLM 将 XQuery 转换为 SQL 的讨论正在进行中,关于是否需要微调,或者混合解析和提示工程是否足够。另外,中国的 AI 进展,特别是来自 DeepSeek 的进展,正在挑战该领域美国领先的说法,政府支持和成本效益高的…
-
AI幻觉仍然是大型语言模型的一个顽固缺陷,导致虚构事实和法律案件。
一位记者指出了DeepSeek捏造传记细节的倾向,这个问题被称为AI幻觉。大型语言模型自信地将不正确的信息当作事实呈现,这是该行业面临的一个持续性挑战。中国法律体系已开始着手解决AI幻觉问题,最高人民法院工作报告中出现了首例与AI推荐相关的侵权案件。
-
DeepSeek 的 V4 模型省略了 Engram 记忆模块,引发了讨论和新研究
DeepSeek 最新的 V4 模型显著省略了 Engram,这是一个与北京大学共同开发的创新记忆和效率模块。Engram 的设计目的是通过允许直接知识查找而不是重新计算静态信息来增强 Transformer,人们曾预计它将成为 V4 的基础组成部分。尽管 Engram 未包含在 V4 中,但其原理正在后续研究中被探索,包括用于多机部署的 CXL 内存池、其哈希机制的实验验证以及向视觉模态的适应。
-
DeepSeek 发布 V4,最大的开源人工智能模型,基于中国芯片构建
DeepSeek 发布了 DeepSeek V4,据称是迄今为止最大的开源人工智能模型。该新模型能够在中国制造的芯片上运行,并且运行成本比同类模型低得多。此次发布值得关注,因为它紧随黄仁勋关于大型开源人工智能模型的潜在负面后果的评论之后。
-
百度推出DuMate应用;讨论AI模型估值
百度为其AI伴侣DuMate推出了一款移动应用,集成了搜索和任务执行等核心AI能力。另外,有报道称中国的Kimi和DeepSeek AI模型正在进行估值,并就其价值展开讨论。此外,还提到了AI的进展及其潜在影响,包括英伟达CEO黄仁勋在毕业典礼上的讲话,他认为AI正在创造一个公平的竞争环境。
-
科技巨头抑制 AI 使用,因“tokenmaxxing”推高成本
据报道,微软、Meta 和亚马逊等主要科技公司正因成本不断攀升而缩减内部 AI 使用量,这主要由代理式 AI 工具消耗的 token 数量增加所驱动。这种被称为“tokenmaxxing”的现象,即员工广泛使用 AI 来达成生产力目标,在某些情况下比人力成本更高。微软决定停止使用 Claude Code 许可证,转而使用自家的 GitHub Copilot CLI,正是这一趋势的体现,这既是为了削减成本,也是为了控制内部开发流程的战略举措。
-
DeepSeek推出多模态AI图像理解模式
知名人工智能实验室DeepSeek目前正处于其新的“图像理解模式”的灰度测试阶段。这项多模态功能允许AI描述上传的图像,早期用户报告其响应速度与“闪电模式”相当。该功能预计将增强DeepSeek处理和解释视觉信息的能力,超越简单的文本交互。