uncertainty quantification
PulseAugur coverage of uncertainty quantification — every cluster mentioning uncertainty quantification across labs, papers, and developer communities, ranked by signal.
6 天有情绪数据
-
贝叶斯深度学习通过新的采样和推理方法取得进展
两篇新研究论文提出了贝叶斯深度学习的进展,重点是改进神经网络的推理方法。第一篇论文认为,基于采样的推理(SAI)在计算上已与优化方法相当,应成为不确定性量化的标准。第二篇论文介绍了一种新颖的、可扩展的基于分数的变分推理方法,该方法避免了重参数化采样,并且可以处理像Vision Transformers这样的大规模网络,解决了其他方法中存在的模式崩溃等问题。
-
深度集成未能捕捉图神经网络中的不确定性
一项新的研究论文质疑了深度集成在图神经网络中进行不确定性量化的有效性。研究发现,集成模型相比单一模型在不确定性量化方面几乎没有改进,其收益主要来自稳定预测而非提高不确定性估计。这归因于“认知崩溃”,即独立训练的网络产生过于相似的预测,从而抵消了集成模型的核心优势。
-
论文:LLM不确定性量化是错误的无监督聚类
一篇新论文认为,目前量化大型语言模型(LLM)不确定性的方法存在根本性缺陷,将其比作无监督聚类算法。这些方法主要衡量内部一致性而非外部正确性,因此无法检测到自信的幻觉。作者主张范式转变,采用将验证锚定在客观真理上的不确定性量化(UQ)方法,以确保模型置信度能可靠地反映现实。
-
新框架生成上下文感知高斯界限以实现人工智能不确定性
研究人员开发了一个新颖的学习框架,用于生成上下文感知的高斯界限以进行不确定性量化。该方法训练神经网络生成均值和尺度估计,在定义的量化网格上提供可证明的保守性,并在特定假设下提供连续尾部保守性。与传统的全局界限相比,该方法旨在提供冗余更少、适应性更强的不确定性估计,适用于航空和自动驾驶等安全关键应用。
-
几何自编码器增强工程推理的贝叶斯反演
研究人员开发了用于贝叶斯反演的几何自编码器(GABI),这是一个旨在提高工程推理任务中不确定性量化的新框架。GABI 从多样化数据集中学习几何感知生成模型,使其能够作为贝叶斯反演的强大先验,而无需明确了解控制物理定律。这种方法允许从有限的观测中恢复全场信息,即使在复杂的几何场景下也是如此,并且在适用的情况下,其预测精度可与监督学习方法相媲美。
-
AI系统通过高效再训练增强半导体质量控制
研究人员开发了一个用于半导体制造中预测质量控制的稳健AI系统,利用MLOps和不确定性量化。他们的研究基于五年的制造数据,发现每生产五个批次进行一次固定的再训练,且不进行超参数调整,可以提供卓越的性能和计算效率。该系统采用一致性预测来生成统计上保证的置信区间,通过识别预测何时超出可接受范围来实现主动质量管理。
-
LLM 研究解决函数调用和系统传播中的不确定性问题
两篇新研究论文探讨了大型语言模型(LLM)中不确定性的关键问题。第一篇论文研究了专门针对 LLM 函数调用的不确定性量化方法,发现简单的单样本方法可以有效,并且可以通过分析输出来改进。第二篇论文解决了复杂 LLM 系统中的不确定性传播问题,提出了一个框架来理解错误如何在各种系统组件和过程中累积。