arXiv
PulseAugur coverage of arXiv — every cluster mentioning arXiv across labs, papers, and developer communities, ranked by signal.
- instance of graph neural networks 95%
- authored by Markov decision processes: a tool for sequential decision making under uncertainty 95%
- instance of reinforcement learning 90%
- instance of federated learning 90%
- authored by stochastic gradient descent 90%
- instance of Vision Language Models 90%
- instance of Multimodal Large Language Models and Tunings: Vision, Language, Sensors, Audio, and Beyond 90%
- instance of Kolmogorov-Arnold Networks 90%
- instance of Pinnschmidt 90%
- authored by GPT-5.1 90%
- developed by muon 90%
- authored by Langevin dynamics 90%
- 2026-05-26 research_milestone Publication of a research paper detailing a new multi-agent dialog system for industrial asset operations and maintenance. 来源
- 2026-05-20 research_milestone A new paper detailing a two-phase non-parametric retrieval workflow for corporate credit underwriting was published on arXiv. 来源
- 2026-05-18 controversy Controversy over AI-generated articles with fabricated citations on ArXiv. 来源
- 2026-05-17 regulatory arXiv will ban authors for one year if they allow AI to generate their work without significant human oversight. 来源
- 2026-05-16 regulatory ArXiv implements a policy to ban authors for a year if they rely entirely on AI for their submissions. 来源
- 2026-05-16 regulatory ArXiv will ban authors for one year if AI does all the work on their submissions. 来源
- 2026-05-15 regulatory arXiv implements a new policy against AI-generated hallucinations in research papers.
- 2026-05-15 regulatory arXiv is implementing a new policy to ban users who submit AI-generated content with hallucinations. 来源
- 2026-05-15 regulatory arXiv implements a new policy to ban submitters of AI-generated hallucinations. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban authors for one year if their submitted papers show incontrovertible evidence of unchecked AI generation. 来源
- 2026-05-15 regulatory ArXiv implements a new policy banning researchers for one year for submitting AI-generated papers. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban researchers for one year if their submissions contain incontrovertible evidence of unchecked AI-generated content. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban researchers for one year for submitting papers with unchecked AI-generated content. 来源
- 2026-05-15 regulatory ArXiv implements a new policy banning researchers for one year for submitting papers with unchecked AI-generated content. 来源
25 天有情绪数据
-
研究表明AI天气模型可能在模拟物理定律
研究人员发表了一篇论文,探讨了AI天气模型可能在模拟的潜在物理原理。研究表明,尽管架构不同,各种AI模型以相似的方式表示大气行为。该论文提出,这些模型可能正在实现对大气的基于粒子的描述,粒子的运动由学习到的自由能泛函指导。
-
新框架应对时间序列无监督异常检测
两篇新的研究论文提出了用于检测多元时间序列数据中异常的新型无监督学习框架。第一个,CALAD,引入了一种通道感知对比学习方法,该方法优先考虑与异常相关的通道以提高信号检测能力。第二个,ContrastAD,利用动态图对比正则化,适应不断变化的变量间依赖关系,并使用结构演化作为学习信号。与现有技术相比,这两种方法在各种真实世界数据集上都表现出卓越的性能,尤其是在标记数据稀缺和分布变化的情况下。
-
New sampling bounds achieve optimal error for regularized classification
研究人员为正则化分类开发了新的采样界限,在广泛的 Lipschitz 连续损失函数上实现了最优的 $(1\pm\varepsilon)$-相对误差。该研究提出了改进的采样复杂度界限,具体来说,对于 L2 正则化是 $k^2/\varepsilon^2$,对于 L1 正则化是 $k/\varepsilon^2$。这些发现依赖于简单的均匀或范数采样,并且通过改进的论证来避免重复计数问题,显著优于之前的敏感性采样界限。
-
NLG 评估方法从语言学演变为 LLM-即裁判
一篇 arXiv 上的新论文回顾了自然语言生成 (NLG) 评估方法的演变。它追溯了从早期的语言学联系到当前以机器学习为中心的方法的转变,并强调了 LLM-即裁判等技术的出现。该论文预测,随着 NLG 技术的普及,影响、定性方面和安全评估将变得更加重要。
-
语言模型从稀疏数据中重构流场
研究人员开发了一种新颖的算子学习框架,利用语言模型架构从稀疏数据中重构流场。该方法将稀疏测量视为上下文,将未观测位置视为查询,实现了无网格重构。该方法在包括流体动力学和温度数据在内的各种数据集上展示了具有竞争力的准确性,即使在观测数据少于 10% 的情况下,也凸显了其在科学数据重构方面的潜力。
-
新方法从网络拓扑学习稳定性景观
研究人员引入了一种新的分析同步网络的方法,通过直接从图拓扑学习“稳定性景观”。该方法采用图到图像的预测范式,其中图神经网络对网络结构进行编码,卷积神经网络解码器生成景观。该研究还发布了两个数据集来支持这项任务,并证明了这些复杂的稳定性景观是可学习的,比传统的标量指标提供了更细致的理解。
-
TubiFM 使用 Llama 3.2 1B 模型统一流媒体发现
研究人员开发了 TubiFM,一个统一流媒体平台的物品、轮播和搜索排名的模型。通过将用户旅程表示为称为“用户故事”的单个 token 序列,TubiFM 利用 Llama 3.2 1B 基础模型进行各种发现任务的下一个 token 预测。这种方法显著提高了搜索和轮播观看时间,同时降低了延迟并简化了整体排名系统。
-
智能手表利用运动和心率数据检测酒驾
研究人员开发了一个系统,使用现成的智能手表来检测酒精影响下的驾驶。该系统分析手腕加速度计数据和心率变异性来识别醉酒程度。在一项对54名参与者的测试赛道研究中,卷积神经网络在检测任何酒精影响方面达到了0.88的AUROC,在检测高于世界卫生组织限值的水平方面达到了0.86。这项工作首次在真实车辆环境中通过消费级智能手表演示了酒驾检测。
-
新理论使强化学习智能体能够从人类偏好中学习
研究人员开发了一个仅使用人类偏好反馈进行强化学习的理论框架。该方法应用于情节核马尔可夫决策过程(MDP),允许智能体通过比较轨迹并接收二元偏好标签来学习最优策略。该研究为次线性遗憾界提供了理论保证,表明在足够的情节下,学习到的策略值会收敛到最优策略值。
-
MetaEvaluator 提供具有成本效益、无需标签的模型评估
研究人员开发了 MetaEvaluator,一个新颖的框架,旨在实现机器学习模型的成本效益高且无需标签的评估。这个模型无关的系统利用元学习在无标签数据集上评估新模型,克服了依赖昂贵标注或重新训练的传统方法的局限性。该框架旨在通过在参考模型池中分摊成本,使新兴模型的规模化基准测试更加实用。
-
AI模型应对复杂的飞机拆解调度
研究人员开发了新的计算模型来优化复杂的飞机拆解调度。这一过程对于航空业的可持续性和盈利能力至关重要,涉及数千项任务和众多约束。提出的解决方案包括一个约束规划模型和一个混合整数规划(MIP)模型,并在具有多达1450个任务的真实世界数据上进行了测试。
-
新模型用稀疏特征解释神经网络缩放定律
研究人员开发了一个新模型来理解存在稀疏激活时的神经网络缩放定律。该模型揭示了测试损失可能受到训练期间未见的罕见数据点的显著影响,从而造成独特的瓶颈。该研究推导了渐近总体损失,显示在插值阈值附近存在双下降峰值,并且在过参数化和欠参数化状态下具有不同的缩放指数,其差距取决于稀疏性。
-
机器人学研究发现125个样本足以满足ANN逆运动学需求
一篇新发表在arXiv上的研究论文,探讨了人工神经网络(ANN)准确解决机器人学中逆运动学(IK)问题所需的最佳训练样本数量。研究发现,超过125个训练样本后,额外的数据并不能显著提高模型的效率或近似精度。这项工作为优化基于ANN的IK解决方案中的数据需求提供了实用指导,平衡了计算成本与机器人应用所需的精度。
-
面向论证对话的新安全、活性和公平性概念
研究人员为定量论证对话引入了新的安全、活性和公平性概念。这些概念借鉴了时间推理,并应用于具有在推理之间更新的加权节点的论证图。该工作正式展示了这些概念之间的关系,并讨论了提供通用保证的分析挑战。
-
PathNavigate代理使用惊喜引导扫描进行病理图像VQA
研究人员开发了PathNavigate,这是一种新颖的、无需训练的代理,专为病理学中的全切片图像视觉问答而设计。该代理采用独特的扫描-搜索-读出例程,利用惊喜场识别异常区域,然后再关注问题条件目标。PathNavigate利用共享在线记忆和冻结的病理学特征,提高了分析吉像素病理切片时的准确性和可解释性。
-
论文探讨检索模型的维度限制
研究人员调查了低维表示(通常在1000维左右)为何不会阻碍现代基于嵌入的检索模型扩展到数万亿数据点。他们的研究侧重于最大间隔嵌入,并指出,通过一个取决于数据大小对数维度的维度,可以实现接近最优的间隔。这些发现解决了先前关于k稀疏行的设置,并表明Sigmoid损失在生成大间隔嵌入方面优于InfoNCE。
-
新框架优化分布式空间天线设计
研究人员开发了一个新的分布式空间天线系统级设计框架,该框架利用电磁编队飞行(EMFF)。该框架解决了与天线性能、卫星质量、发电和编队保持相关的耦合约束。该系统旨在最大化天线孔径,同时考虑卫星级尺寸和控制要求,特别适用于直连设备通信场景。
-
新AI模型通过作物特异性物候学增强多作物产量预测
研究人员开发了PhenoYieldNet,一个旨在改进多种作物类型产量预测的新框架。该模型通过分析对时间驱动因素的响应来显式学习作物特异性物候学,利用作物物候库和注意力模块来捕捉相关模式。该系统利用预训练的基础模型和自监督适应来进行鲁棒的特征学习,在实验中展示了卓越的性能和泛化能力。
-
新型CBANet模型提升危险驾驶检测能力
研究人员开发了CBANet,一个新的人工智能深度学习框架,旨在利用车辆传感器数据检测危险驾驶事件。该模型通过构建工程化的动态特征并采用过采样和类别加权损失的稳定训练策略,解决了数据不平衡和驾驶员可变性等挑战。CBANet旨在通过更准确地识别危险驾驶行为来提高道路安全,在少数类召回率和安全关键指标方面优于现有基线模型。
-
新的CADENCE框架可从稀疏数据预测个体动态
研究人员开发了CADENCE,一个新颖的概率框架,旨在从极其稀疏的数据快照中推断连续的个体轨迹。该方法克服了现有方法的局限性,这些方法要么需要密集的纵向数据,要么在分析横断面数据时会丢失个体动态。CADENCE将潜在动态锚定到静态的、个体层面的上下文,为单时间点轨迹推断提供了可识别性保证。该框架结合了基于分数的空间编码器和软专家混合路由器,以联合识别个体动态参数和路由函数。在包括生物数据在内的各种基准测试中,CADENCE的表现与在密…