optimal transport
PulseAugur coverage of optimal transport — every cluster mentioning optimal transport across labs, papers, and developer communities, ranked by signal.
7 天有情绪数据
-
新研究探索用于大型语言模型和扩散模型的先进奖励建模
几篇新研究论文探讨了用于人工智能对齐的奖励建模的进展,特别是针对大型语言模型和扩散模型。其中一篇论文介绍了SelectiveRM,一个使用最优传输来处理奖励建模中嘈杂的人类偏好的框架。另一篇论文CAMEL提出了一种置信门控反射方法,选择性地对低置信度实例调用反射,以更少的参数实现了最先进的准确性。此外,还开发了一个名为RMGAP的新基准来评估奖励模型在不同用户偏好上的泛化能力,揭示了当前模型的重大局限性。最后,ArenaPO利用Are…
-
Aitchison几何驱动新的成分图嵌入和风味标记器校准
两篇新的arXiv论文引入了使用Aitchison几何的表示学习新方法。一篇论文提出了一种通过将高能物理中的风味标记器校准构建为概率单纯形上的最优传输问题来校准风味标记器的框架。另一篇论文提出了一个成分图嵌入框架,该框架利用Aitchison几何为节点分类和链接预测等图机器学习任务创建可解释的嵌入。
-
新的USB框架从快照重建离散细胞动力学
研究人员开发了一个名为Unbalanced Schrödinger Bridge (USB) 的新无模拟框架,用于从单细胞数据重建离散分支动力学。该方法通过在单细胞水平上准确捕捉细胞增殖和凋亡等生灭事件,解决了现有连续流体模型的局限性。USB整合了随机性和不平衡效应,提供了细胞谱系分支和命运决定的微观解释,并在模拟和真实世界数据集上均表现出强大的性能。
-
New techniques like UniVer and SpecKV boost LLM inference speed via speculative decoding
Researchers have developed new methods to accelerate large language model (LLM) inference. UniVer offers a unified approach to multi-step and multi-draft speculative decoding, improving acceptance length by up to 8.5%. …
-
New optimal transport methods offer improved accuracy and scalability
Researchers have introduced Sliced-Regularized Optimal Transport (SROT), a novel formulation that regularizes transport plans towards a smoothed sliced OT plan, offering more accurate approximations than entropic OT. A …