PulseAugur
实时 12:46:30
实体 MinHash LSH

MinHash LSH

PulseAugur coverage of MinHash LSH — every cluster mentioning MinHash LSH across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_91516 ·

    ML数据污染使Qwen3-8B模型性能虚增9个点

    Nexus Labs的一个机器学习团队发现,他们微调的Qwen3-8B模型性能显著提升是由于数据污染造成的。该模型在票务路由任务上达到了80.4%的准确率,远高于基础模型的71.2%,但这种提升是虚假的。在使用MinHash LSH检测训练集和评估集之间的近乎重复条目后,他们发现大约6%的评估数据无意中被包含在了训练集中。在移除这些受污染的样本后,模型的真实准确率接近72%,表明微调过程的实际改进微乎其微。