PulseAugur
实时 03:23:01
English(EN) Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

贝叶斯框架增强了大型MoE模型中的不确定性

研究人员开发了变分混合专家路由(VMoER),一种新的贝叶斯框架,旨在提高大规模基础模型中的不确定性量化能力。该方法将贝叶斯推理集中在混合专家(MoE)层内的专家选择过程中,这是实现大规模模型的一种常用技术。VMoER在路由稳定性、校准误差降低和分布外检测方面取得了显著改进,同时计算开销极小。 AI

影响 为实现更强大、更具不确定性感知能力的基础模型提供了一条可扩展的路径,这对于负责任的AI部署至关重要。

排序理由 该集群包含一篇研究论文,详细介绍了用于改进大型模型不确定性量化能力的新框架。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv stat.ML TIER_1 English(EN) · Albus Yizhuo Li, Matthew Wicker ·

    变分路由:用于校准专家混合Transformer的可扩展贝叶斯框架

    arXiv:2603.09453v3 Announce Type: replace-cross Abstract: Foundation models are increasingly being deployed in contexts where understanding the uncertainty of their outputs is critical to ensuring responsible deployment. While Bayesian methods offer a principled approach to uncer…