PulseAugur
实时 20:19:09
实体 DeepSeek-V3-family

DeepSeek-V3-family

PulseAugur coverage of DeepSeek-V3-family — every cluster mentioning DeepSeek-V3-family across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_56090 ·

    研究发现:医疗AI模型答案更准确但推理能力下降

    一篇新发表在arXiv上的研究揭示了一个令人担忧的医疗问答模型趋势:虽然经过蒸馏的模型在最终答案上准确性有所提高,但它们的推理过程可能会显著退化。研究人员发现,一个Qwen3-8B模型,通过从DeepSeek-V3系列教师模型进行链式思考蒸馏训练后,在MedQA-USMLE上的答案指标有所改善,但在由LLM裁判审计时,其逐步推理的错误率却更高。这种答案质量和追踪事实性出现分歧的现象,在各种医疗基准测试和模型配置中都有观察到,表明标准的…