uncertainty quantification

新的深度学习模型在无人工标注的情况下对天文瞬变体进行分类

研究人员开发了一种新颖的深度学习框架，用于将天文瞬变体分类为真实或虚假，而无需人工标注数据。该方法利用注入的模拟瞬变体和受污染的调查数据集，采用不对称协同教学来处理不同的标签噪声水平。该框架还结合了混合不确定性量化策略，结合MC Dropout和深度集成，为其分类提供校准的置信度。该方法旨在实现时域调查中可扩展且一致的真实-虚假分类，即使在标签有噪声或有限的情况下也是如此。

TOOL · CL_119530 · Jul 1 · 04:00

新的冯·米塞斯集成方法改进了汽车雷达的不确定性量化

研究人员开发了一种新的汽车雷达系统不确定性量化方法，使用冯·米塞斯（VM）集成，与证据深度学习（EDL）相比，该方法提供了更好的可解释性和几何一致性。VM集成提供了角度预测参数（mu，kappa），可以直接进行概率集成到检测和跟踪流程中。虽然EDL显示出更平滑的不确定性变化，但VM方法在名义条件下表现更好，并且对严重扰动更敏感，突显了几何一致性与统计通用性之间的权衡。

TOOL · CL_117709 · Jun 30 · 04:00

新框架为等变推理提供统计保证

一篇新的研究论文介绍了一个等变表示学习框架，旨在提高回归、条件概率估计和不确定性量化中的泛化能力和样本效率。该框架基于算子和群表示理论，近似条件期望算子的谱分解。在合成和真实机器人数据集上的实证评估表明，其在回归方面能与现有等变基线相媲美或超越，同时提供校准良好的不确定性估计。

RESEARCH · CL_115292 · Jun 26 · 03:43

新研究推动扩散模型在图像编辑、数据增强和遗忘方面的进展

研究人员正在探索扩散模型的先进技术，重点是改进图像编辑、数据增强和遗忘能力。新方法旨在通过改进ODE求解器和矢量场平滑来提高图像编辑的稳定性和保真度。对于数据增强，正在开发不确定性指导策略，通过关注信息区域来改进语义分割模型。此外，扩散模型遗忘方面的进展正在取得，研究调查了选择性遗忘和使用稀疏自编码器将概念检测与干预分离，旨在获得更清晰的结果并更好地保留模型质量。

RESEARCH · CL_109960 · Jun 25 · 04:00

新方法推进机器学习中的不确定性量化 · 跟踪5个来源

研究人员介绍了评估机器学习模型中不确定性量化（UQ）的新方法。一种称为“决策对齐”的方法旨在确保UQ指标与下游决策效用有意义地相关，从而揭示了当前通用指标的缺陷。另一项进展侧重于多模态回归任务的高效UQ，将变分贝叶斯推理扩展到分位数回归和分类恢复等模型。此外，还提出了一种名为Ribbon的可扩展近似方法，该方法通过近似贝叶斯自举方法而不要求重复模型重新拟合，从而提供鲁棒的不确定性量化。

TOOL · CL_100187 · Jun 19 · 04:00

新的QUEST框架在机器学习中提供了改进的不确定性量化

一种名为QUEST（Quantifying Uncertainty via highest dEnSiTy regions）的新框架已被提出用于机器学习中的不确定性量化。该方法通过分布支撑集中最可能子集的体积来表征不确定性，为基于适当评分规则的方法提供了一种替代方案。QUEST度量已被证明满足不确定性量化的关键公理，并在选择性预测基准测试中与方差和微分熵等标准度量相比表现良好。

TOOL · CL_77339 · Jun 8 · 04:00

综述论文强调符号回归中不确定性量化的必要性

一篇新的综述论文解决了符号回归（SR）方法中不确定性量化（UQ）的关键差距。该论文旨在介绍UQ概念并回顾现有文献，将当前研究分为频率学派、贝叶斯学派和模型选择方法。尽管UQ对于模型可靠性和决策至关重要，但在SR中仍是一个未被充分探索的领域，凸显了进一步研究的必要性。

RESEARCH · CL_65604 · Jun 1 · 11:20

新方法通过处理歧义来改进 LLM 错误预测

研究人员开发了一种新方法，通过区分输入歧义和不确定性量化 (UQ) 信号来改进大型语言模型 (LLM) 中的错误预测。该研究在问答任务上进行，发现当问题有多个合理答案时，UQ 指标在预测错误方面的效果不佳。通过引入歧义标签，新方法显著提高了各种 LLM 系列和数据集的错误预测准确性。

RESEARCH · CL_62213 · May 29 · 02:09

最后一层线性化匹配全网络UQ性能

一篇新的研究论文探讨了仅使用深度神经网络的最后一层进行不确定性量化的有效性。研究发现，这种称为最后一层线性化的简化方法在模拟认知不确定性方面，提供了与全网络线性化相当的性能。该方法显著提高了计算效率，使其成为关键应用中安全部署AI的可行选项。

RESEARCH · CL_55983 · May 27 · 05:03

新的贝叶斯知识蒸馏框架增强模型压缩

研究人员推出了一种新颖的多教师贝叶斯知识蒸馏（MT-BKD）框架，旨在改进模型压缩和不确定性量化。该方法通过利用贝叶斯推理来捕捉固有的不确定性，使学生模型能够从多个教师模型中学习。MT-BKD 包含一个教师信息先验，该先验整合了外部知识，并使用基于熵的加权机制来适应性地调整每个教师的影响力，从而提高泛化能力和鲁棒性。

RESEARCH · CL_44878 · May 22 · 04:00

贝叶斯深度学习通过新的采样和推理方法取得进展

两篇新研究论文提出了贝叶斯深度学习的进展，重点是改进神经网络的推理方法。第一篇论文认为，基于采样的推理（SAI）在计算上已与优化方法相当，应成为不确定性量化的标准。第二篇论文介绍了一种新颖的、可扩展的基于分数的变分推理方法，该方法避免了重参数化采样，并且可以处理像Vision Transformers这样的大规模网络，解决了其他方法中存在的模式崩溃等问题。

RESEARCH · CL_44041 · May 21 · 15:07

深度集成未能捕捉图神经网络中的不确定性

一项新的研究论文质疑了深度集成在图神经网络中进行不确定性量化的有效性。研究发现，集成模型相比单一模型在不确定性量化方面几乎没有改进，其收益主要来自稳定预测而非提高不确定性估计。这归因于“认知崩溃”，即独立训练的网络产生过于相似的预测，从而抵消了集成模型的核心优势。

RESEARCH · CL_40851 · May 19 · 00:47

论文：LLM不确定性量化是错误的无监督聚类

一篇新论文认为，目前量化大型语言模型（LLM）不确定性的方法存在根本性缺陷，将其比作无监督聚类算法。这些方法主要衡量内部一致性而非外部正确性，因此无法检测到自信的幻觉。作者主张范式转变，采用将验证锚定在客观真理上的不确定性量化（UQ）方法，以确保模型置信度能可靠地反映现实。

RESEARCH · CL_36351 · May 15 · 09:47

新框架生成上下文感知高斯界限以实现人工智能不确定性

研究人员开发了一个新颖的学习框架，用于生成上下文感知的高斯界限以进行不确定性量化。该方法训练神经网络生成均值和尺度估计，在定义的量化网格上提供可证明的保守性，并在特定假设下提供连续尾部保守性。与传统的全局界限相比，该方法旨在提供冗余更少、适应性更强的不确定性估计，适用于航空和自动驾驶等安全关键应用。

TOOL · CL_30946 · May 14 · 04:00

几何自编码器增强工程推理的贝叶斯反演

研究人员开发了用于贝叶斯反演的几何自编码器（GABI），这是一个旨在提高工程推理任务中不确定性量化的新框架。GABI 从多样化数据集中学习几何感知生成模型，使其能够作为贝叶斯反演的强大先验，而无需明确了解控制物理定律。这种方法允许从有限的观测中恢复全场信息，即使在复杂的几何场景下也是如此，并且在适用的情况下，其预测精度可与监督学习方法相媲美。

TOOL · CL_26344 · May 8 · 13:57

AI系统通过高效再训练增强半导体质量控制

研究人员开发了一个用于半导体制造中预测质量控制的稳健AI系统，利用MLOps和不确定性量化。他们的研究基于五年的制造数据，发现每生产五个批次进行一次固定的再训练，且不进行超参数调整，可以提供卓越的性能和计算效率。该系统采用一致性预测来生成统计上保证的置信区间，通过识别预测何时超出可接受范围来实现主动质量管理。

RESEARCH · CL_06612 · Apr 28 · 04:00

LLM 研究解决函数调用和系统传播中的不确定性问题

两篇新研究论文探讨了大型语言模型（LLM）中不确定性的关键问题。第一篇论文研究了专门针对 LLM 函数调用的不确定性量化方法，发现简单的单样本方法可以有效，并且可以通过分析输出来改进。第二篇论文解决了复杂 LLM 系统中的不确定性传播问题，提出了一个框架来理解错误如何在各种系统组件和过程中累积。