PulseAugur
实时 02:36:46
实体 DeepSeek-V3.2-Exp

DeepSeek-V3.2-Exp

PulseAugur coverage of DeepSeek-V3.2-Exp — every cluster mentioning DeepSeek-V3.2-Exp across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 3 条
  1. RESEARCH · CL_99670 ·

    新方法通过分解不确定性来增强 LLM 智能体的澄清寻求能力

    研究人员开发了一种新颖的方法,使 LLM 智能体能够通过分解不确定性来提高其寻求澄清的能力。该方法将行动置信度与请求不确定性分开,使智能体能够在任务规范模糊时主动寻求澄清。该方法在新基准上进行了评估,与现有技术相比,在多个 LLM 主干上澄清 F1 分数有了显著提高。

  2. RESEARCH · CL_83786 ·

    Hugging Face Transformers 添加 MiniMax-M3-VL、DeepSeek-V3.2 和 DiffusionGemma

    Hugging Face Transformers 库已发布 5.12.0 版本,引入了 MiniMax-M3-VL 等新模型,这是一个具有 CLIP 式视觉塔和稀疏专家混合解码器的视觉语言模型。此次更新还包括对 PP-OCRv6(一个高效的 OCR 系统)和 Parakeet-RNNT(一个带有 RNN-T 解码器的快速 Conformer 编码器)的改进。此外,5.11.0 版本添加了 DiffusionGemma(一个用于更快文…

  3. TOOL · CL_11198 ·

    DeepSeek 修复 V3.2-Exp 推理演示中的 RoPE 实现不匹配问题

    DeepSeek 已在其 DeepSeek-V3.2-Exp 推理演示的早期版本中发现了一个导致性能下降的 bug。该问题源于 indexer 模块中 RoPE 实现的不匹配,早期版本期望非交错输入,而 MLA RoPE 期望交错输入。现已实施修复,可通过其 GitHub 存储库获取。