English(EN) SIEVES: Selective Prediction Generalizes through Visual Evidence Scoring

SIEVES 方法通过证据评分提升多模态大模型在视觉任务上的覆盖率

作者 PulseAugur 编辑部 · [3 个来源] · 2026-04-28 16:57

研究人员开发了 SIEVES，一种用于提高多模态大语言模型（MLLMs）在分布外场景下可靠性的新方法。SIEVES 通过学习估计推理模型提供的视觉证据质量来实现选择性预测。这种方法显著提高了模型覆盖率，在具有挑战性的基准测试中最高可提高三倍。值得注意的是，SIEVES 可以应用于 Gemini-3-Pro 等专有模型，而无需访问其内部权重或 logits。 AI

影响通过改进选择性预测和泛化到未见数据，提高 MLLMs 在真实世界场景下的可靠性。

排序理由介绍多模态大模型泛化新方法的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 3 个来源。我们如何撰写摘要 →

报道来源 [3]

Hugging Face Daily Papers TIER_1 English(EN) · 2026-04-28 16:57

SIEVES: Selective Prediction Generalizes through Visual Evidence Scoring

Multimodal large language models (MLLMs) achieve ever-stronger performance on visual-language tasks. Even as traditional visual question answering benchmarks approach saturation, reliable deployment requires satisfying low error tolerances in real-world out-of-distribution (OOD) …
arXiv cs.CV TIER_1 English(EN) · Hector G. Rodriguez, Marcus Rohrbach · 2026-04-29 04:00

SIEVES: Selective Prediction Generalizes through Visual Evidence Scoring

arXiv:2604.25855v1 Announce Type: new Abstract: Multimodal large language models (MLLMs) achieve ever-stronger performance on visual-language tasks. Even as traditional visual question answering benchmarks approach saturation, reliable deployment requires satisfying low error tol…
arXiv cs.CV TIER_1 English(EN) · Marcus Rohrbach · 2026-04-28 16:57

SIEVES: Selective Prediction Generalizes through Visual Evidence Scoring

Multimodal large language models (MLLMs) achieve ever-stronger performance on visual-language tasks. Even as traditional visual question answering benchmarks approach saturation, reliable deployment requires satisfying low error tolerances in real-world out-of-distribution (OOD) …

报道来源 [3]

SIEVES: Selective Prediction Generalizes through Visual Evidence Scoring

SIEVES: Selective Prediction Generalizes through Visual Evidence Scoring

SIEVES: Selective Prediction Generalizes through Visual Evidence Scoring

相关实体

相关话题