PulseAugur
实时 10:01:03
实体 Qwen-3-Next

Qwen-3-Next

PulseAugur coverage of Qwen-3-Next — every cluster mentioning Qwen-3-Next across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_115643 ·

    新基准揭示大型语言模型在医疗保健领域难以平衡安全性和有用性

    引入了一个名为Health-ORSC-Bench的新基准,用于评估大型语言模型在医疗保健场景中的安全对齐情况。该基准通过关注“安全完成”(旨在提供有益的高层指导而不越界至有害领域)来解决过度拒绝和不安全合规的问题。对包括GPT-5和Claude 4在内的30个大型语言模型的评估显示,经过安全优化的模型经常拒绝相当一部分良性查询,而领域特定的模型可能会为了实用性而牺牲安全性。研究表明,与较小的模型或基于MoE的模型相比,更大的前沿模型往…