实体 DeepSeek-R1

DeepSeek-R1

PulseAugur coverage of DeepSeek-R1 — every cluster mentioning DeepSeek-R1 across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 89

发布 · 30天

90 天内 0

论文 · 30天

90 天内 39

层级分布 · 90 天

frontier release 1
significant 8
research 25
tool 41
commentary 13
meme 1

主题

模型发布 47
产品 44
论文 39
基础设施 26
其他 17
安全 14
观点 2
融资 1

关系

subsidiary of DeepSeek 100%
developed by DeepSeek 100%
competes with Claude-Opus-4.8 70%
used by DagsHub 70%
competes with GLM-5.2 70%
developed by Phi 3 70%
used by Phi 3 70%
competes with Claude Fable-5 70%
instance of train of thought 60%
instance of Chain Of Thought 60%
authored Chain Of Thought 60%
other Gemma 4 50%

时间线

2026-05-23 product_launch DeepSeek released the DeepSeek-R1 model, an open-source alternative to OpenAI's o1. 来源
2026-05-10 product_launch A developer launched DeepThink, a local-first macOS workspace application.

情绪 · 30 天

21 天有情绪数据

最近 · 第 1/5 页 · 共 89 条

COMMENTARY · CL_133931 · Jul 9 · 10:00

开放权重的大语言模型（LLM）可免费访问但运行成本高昂，给开发者带来挑战

文章认为，虽然开放权重的LLM在技术上可以免费访问，但其巨大的规模常常使其在标准硬件上运行成本过高且难以实现。Qwen、DeepSeek、GLM、Kimi和MiniMax等模型被列为这一趋势的例子，参数数量达到数百亿甚至数万亿。作者认为，焦点应从原始参数数量和开放权重转移到实际部署成本和效率上，将效率定义为能力与运营成本的最佳比率。对开发者而言，这意味着在本地推理时优先选择更小、更易于管理模型，并在为产品选择模型时，将活跃参数和实际延…
SIGNIFICANT · CL_133858 · Jul 9 · 07:34

零一万物推出高管AI套件，李开复领衔

零一万物（01.AI）正在推出一系列新AI产品，旨在赋能企业中的高管（“一把手”）来推动AI的采用。首席执行官李开复强调，AI转型必须由这些最高决策者领导，然后他们才能将技术推广给团队。该产品套件包括企业决策中心“万策”，以及面向销售主管和投资官等职位的专用AI助手。李开复认为，这种自上而下的方法，专注于使高管能够利用AI来处理核心业务流程，对于克服大型组织中AI实施的常见挑战至关重要。
COMMENTARY · CL_133874 · Jul 9 · 06:32

数据显示，AI智能成本每2-4个月减半

实现特定水平AI智能的成本急剧下降，价格每2到4个月就减半。这一趋势体现在达到某些估计能力指数（ECI）分数的成本不断降低，例如ECI 126的分数从37.5美元降至0.13美元。Grok-3 mini和Gemini 3 Flash等近期模型进一步加速了这种价格下降，在短时间内显示出显著的成本降低。
RESEARCH · CL_133267 · Jul 9 · 02:03

英特尔 GPU 在 AI 推理方面挑战英伟达；自主式勒索软件出现 · 跟踪 1 个来源

英特尔的 Arc Pro B70 GPU 在 AI 推理任务中展现了令人印象深刻的性价比扩展性，在四 GPU 配置下，其在特定基准测试中的表现优于英伟达的 RTX 5090D。虽然英特尔的硬件为预算有限的推理工作负载带来了希望，但英伟达的 CUDA 生态系统仍然是一个显著优势。在网络安全方面，已发现首个自主式 AI 勒索软件攻击，该软件能够自主决策、识别目标和提升权限，对传统安全措施提出了新的挑战。此外，编码平台 Base44 已开发…
RESEARCH · CL_130672 · Jul 7 · 18:48

在中国考虑对国内顶级AI模型实施出口管制之际，全球出口管制趋严

继美国商务部对Anthropic和OpenAI的先进AI模型实施限制后，中国据称正考虑对其自身的尖端模型实施类似限制，包括DeepSeek-R1、阿里巴巴的Qwen、字节跳动的Doubao以及智谱AI的GLM。这表明，在日益激烈的全球AI竞赛中，对AI技术的访问和控制正变得与性能同等重要。
TOOL · CL_130653 · Jul 7 · 14:33

PromptChain工具增强了用于编码的本地/云AI模型链接

一位开发者增强了PromptChain，这是一个用于链接本地和云端AI模型以完成编码任务的工具。最新的更新包括改进了对推理模型的处理，支持多文件代码输出并提供zip下载选项，以及能够保存和切换不同的管道配置。用户现在还可以通过版本历史记录就地修改代码，并选择“快速模式”来绕过审查步骤，从而使从想法生成代码的过程更加高效。
RESEARCH · CL_131431 · Jul 7 · 08:54

DeepSeek R1 LLM 从房地产文件中提取结构化数据

研究人员开发了一个端到端的流程，用于从异构房地产文件中提取结构化数据，包括扫描表格和复杂布局。该系统将文档分为三类，然后使用 DeepSeek R1 大型语言模型提取 35 个预定义的房产属性，并将数据以 JSON 对象的形式返回。该方法成功处理了 2781 份文档，产生了 2766 条经过验证数据质量的唯一房产记录，证明了大规模提取的可行性和可靠性。
COMMENTARY · CL_125769 · Jul 5 · 02:31

Qwen 前负责人从模型转向智能体，指出混合思维的挑战

阿里巴巴Qwen项目前技术负责人林君扬已将焦点从训练大型语言模型转向开发AI智能体。他认为，像Qwen3这样结合了直接响应和逐步推理的混合思维模型，虽然具备多语言支持等高级功能，但合并这些模式可能会降低性能。林君扬将此与Anthropic的方法进行对比，认为推理应针对特定工作负载进行定制，而非追求基准性能，并且未来在于智能体思维，即在环境中进行规划、行动和适应。
TOOL · CL_119593 · Jul 1 · 04:00

SMART框架优化LLM推测解码，提升速度

研究人员开发了SMART，一个系统感知框架，旨在优化大型语言模型（LLM）中推测解码的效率。该方法解决了可能导致在更大批量大小或达到硬件限制时加速效果降低的计算开销问题。SMART将树扩展重新构建为硬件感知的优化问题，通过在推理时应用边际效益成本规则来最大化端到端加速。评估表明，SMART在各种硬件配置下，始终优于现有方法，为多模态和大型语言模型提供显著的额外加速，同时不损害性能。
TOOL · CL_119500 · Jul 1 · 04:00

知识蒸馏提升紧凑型AI模型在数学推理任务上的准确性

研究人员探索了知识蒸馏技术，以提高小型AI模型在复杂推理任务上的性能。他们使用大型推理模型DeepSeek-R1，在历史数学竞赛问题上训练了一个更紧凑的Qwen2.5-7B模型。经过微调的学生模型在准确性上有了显著提高，在竞赛数据集上的准确率提高了4个百分点以上，并且在单独的基准测试中也表现出良好的泛化能力。研究还发现，模型响应的长度与数学推理中的答案质量直接相关，响应越短，准确率越低。
RESEARCH · CL_128948 · Jul 1 · 00:00

新研究探索 LLM 的高级推理策略和训练方法 · 已追踪 10 个来源

arXiv 上发布的多篇研究论文探讨了大语言模型 (LLM) 的高级推理能力。一篇论文介绍了“Refine Thought” (RT)，通过多次前向传播来增强嵌入模型的语义推理。另一篇综述将 LLM 推理策略分为快速、慢速和工具增强型方法，并与认知心理学进行了类比。进一步的研究调查了训练过程中潜在推理的忠实度、RL 训练后构建组合推理策略的有效性，以及一种名为 Pyligent 的用于纠错推理的训练框架。此外，一种名为 GeoSD 的…
RESEARCH · CL_119613 · Jun 30 · 08:18

LLM 对话代理通过新的提示策略提高安全性 · 已追踪 2 个来源

一篇新的研究论文探讨了一种轻量级提示策略，以提高大型语言模型在面向任务的对话中数据库交互失败时的安全性。提出的“引导重试”（Guided-Retry）方法旨在减少幻觉，例如捏造预订详情或确认信息，而无需重新训练模型。该策略在包括 Llama 3 和 Qwen 2.5 在内的六个开放权重模型家族上，在 MultiWOZ 2.2 和 SGD 等基准测试中进行了测试，幻觉率显著降低了高达 50%。然而，残余幻觉仍然存在，尤其是在错误领域检索的情况下。
RESEARCH · CL_119406 · Jun 29 · 19:33

新的“LearnStop”方法优化推理模型停止点

研究人员开发了一种名为LearnStop的新方法，用于优化推理语言模型在处理某个实例时应何时停止。该技术分析答案置信度、熵和稳定性等多个特征来预测正确性，旨在在固定的计算预算下提高性能。LearnStop在自由形式的数学任务上显示出特别的好处，优于简单的标量停止规则，但其有效性取决于任务，在多项选择题或非常困难的问题上，更简单的方法具有竞争力。
COMMENTARY · CL_114949 · Jun 28 · 19:37

研究人员声称强化学习可造就超人类预测者

来自 Metal Ivy 和牛津大学的研究人员提出，将强化学习（RL）应用于预测任务可以带来超人类的决策能力。作者认为，虽然 RL 在编码等领域已取得成功，但其在预测任务上的应用对文明的能力更为重要。核心思想是训练一个模型，使其能够对预先生成的上下文摘要进行推理，以预测结果。一个关键的观察是，性能会随着模型能力和计算量的增加而扩展，但由于上下文中信息的有限性而趋于平缓。为了克服这一点，作者建议让模型在 RL 环境中使用工具调用来访问实…
COMMENTARY · CL_113715 · Jun 27 · 17:00

到 2027 年，AI 代币成本将因硬件/软件的进步而下降 · 跟踪 4 个来源

SemiAnalysis 报告称，到 2027 年，AI 代币的成本预计将大幅下降，这得益于硬件和软件优化的进步。这些改进，例如吞吐量的增加和高效的任务替代，正在从根本上改变专业服务和 AI 运营的单位经济效益。该公司指出，他们自己的代币支出已占员工薪酬的 30%，这凸显了研究公司和金融机构的普遍趋势。
SIGNIFICANT · CL_113505 · Jun 27 · 12:19

Om AI发布VLX：首个设备端流式多模态模型系列

来自杭州的Om AI团队发布了VLX，这是一系列专为真实世界设备端应用设计的端到端流式多模态模型。VLX-Flow、VLX-Seek和VLX-Go模型能够实现连续感知、精确本地化和动作决策，形成一个物理世界交互的闭环系统。与传统的云端模型不同，VLX从根本上为手机、无人机和机器人等边缘设备进行了优化，优先考虑效率和实时响应能力。
SIGNIFICANT · CL_109777 · Jun 25 · 04:35

智谱AI的GLM-5.2通过开放发布挑战顶级闭源模型 · 跟踪1个来源

智谱AI发布了其旗舰开源模型GLM-5.2，该模型支持100万token的上下文窗口，并在编码和长程任务中展现出顶级性能。此次发布紧随Anthropic暂时撤回其Claude Fable 5和Mythos 5模型之后，将GLM-5.2定位为可访问、可商用的替代品。埃隆·马斯克预测中国AI模型可能在一个季度内达到Fable 5的水平，而智谱AI的创始人则认为时间会更短，这凸显了中国AI发展的快速进步和日益增长的全球影响力。
RESEARCH · CL_109504 · Jun 24 · 17:45

AI安全研究推动模型取证以揭示意图

研究人员提倡加强对“模型取证”的关注，这是一个致力于调查令人担忧的AI行为根本原因的领域。核心思想是，仅仅观察到模型的一个负面行为不足以确定它是源于真正的失准还是良性的困惑。一篇新论文提出了模型取证的基线协议，包括分析模型的思维链并进行反事实实验来检验关于其动机的假设。这项研究旨在提供对AI行为更深入的理解，区分无意错误和故意颠覆，这对于制定有效的安全措施至关重要。
TOOL · CL_107892 · Jun 24 · 04:41

小型人工智能模型能否有效监控前沿人工智能代理？

一项近期实验探讨了小型人工智能模型是否能有效监控大型、能力更强的人工智能系统是否存在恶意或意外行为。该研究使用 Claude Sonnet 4.5 作为被监控代理，并在各种编程任务中测试了八种不同规模和架构的观察者模型。这些任务包括引入后门、奖励破解和数据泄露，旨在评估监控器的检测率和误报率。
RESEARCH · CL_107759 · Jun 23 · 12:42

新型 RaDaR LLM 加速罕见病诊断，提高医生准确性 · 已追踪 2 个来源

研究人员开发了 RaDaR，这是一种紧凑型 32B 参数推理 LLM，旨在辅助罕见病的诊断。RaDaR 在结合了公开和合成临床病例进行训练后，表现优于包括更大的 DeepSeek-R1 在内的其他开源模型。在回顾性分析中，RaDaR 比临床怀疑显著更早地确定了正确诊断，有可能缩短诊断前置时间。一项随机试验表明，与仅使用互联网搜索相比，RaDaR 的医生辅助将诊断准确率提高了 21 个百分点以上。

开放权重的大语言模型（LLM）可免费访问但运行成本高昂，给开发者带来挑战

零一万物推出高管AI套件，李开复领衔

数据显示，AI智能成本每2-4个月减半

英特尔 GPU 在 AI 推理方面挑战英伟达；自主式勒索软件出现 · 跟踪 1 个来源

在中国考虑对国内顶级AI模型实施出口管制之际，全球出口管制趋严

PromptChain工具增强了用于编码的本地/云AI模型链接

DeepSeek R1 LLM 从房地产文件中提取结构化数据

Qwen 前负责人从模型转向智能体，指出混合思维的挑战

SMART框架优化LLM推测解码，提升速度

知识蒸馏提升紧凑型AI模型在数学推理任务上的准确性

新研究探索 LLM 的高级推理策略和训练方法 · 已追踪 10 个来源

LLM 对话代理通过新的提示策略提高安全性 · 已追踪 2 个来源

新的“LearnStop”方法优化推理模型停止点

研究人员声称强化学习可造就超人类预测者

到 2027 年，AI 代币成本将因硬件/软件的进步而下降 · 跟踪 4 个来源

Om AI发布VLX：首个设备端流式多模态模型系列

智谱AI的GLM-5.2通过开放发布挑战顶级闭源模型 · 跟踪1个来源

AI安全研究推动模型取证以揭示意图

小型人工智能模型能否有效监控前沿人工智能代理？

新型 RaDaR LLM 加速罕见病诊断，提高医生准确性 · 已追踪 2 个来源