arXiv
PulseAugur coverage of arXiv — every cluster mentioning arXiv across labs, papers, and developer communities, ranked by signal.
- instance of graph neural networks 95%
- authored by Markov decision processes: a tool for sequential decision making under uncertainty 95%
- instance of reinforcement learning 90%
- instance of federated learning 90%
- authored by stochastic gradient descent 90%
- instance of Vision Language Models 90%
- instance of Multimodal Large Language Models and Tunings: Vision, Language, Sensors, Audio, and Beyond 90%
- instance of Kolmogorov-Arnold Networks 90%
- instance of Pinnschmidt 90%
- authored by GPT-5.1 90%
- developed by muon 90%
- used by SAM2 90%
- 2026-05-26 research_milestone Publication of a research paper detailing a new multi-agent dialog system for industrial asset operations and maintenance. 来源
- 2026-05-20 research_milestone A new paper detailing a two-phase non-parametric retrieval workflow for corporate credit underwriting was published on arXiv. 来源
- 2026-05-18 controversy Controversy over AI-generated articles with fabricated citations on ArXiv. 来源
- 2026-05-17 regulatory arXiv will ban authors for one year if they allow AI to generate their work without significant human oversight. 来源
- 2026-05-16 regulatory ArXiv implements a policy to ban authors for a year if they rely entirely on AI for their submissions. 来源
- 2026-05-16 regulatory ArXiv will ban authors for one year if AI does all the work on their submissions. 来源
- 2026-05-15 regulatory arXiv implements a new policy against AI-generated hallucinations in research papers.
- 2026-05-15 regulatory arXiv is implementing a new policy to ban users who submit AI-generated content with hallucinations. 来源
- 2026-05-15 regulatory arXiv implements a new policy to ban submitters of AI-generated hallucinations. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban authors for one year if their submitted papers show incontrovertible evidence of unchecked AI generation. 来源
- 2026-05-15 regulatory ArXiv implements a new policy banning researchers for one year for submitting AI-generated papers. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban researchers for one year if their submissions contain incontrovertible evidence of unchecked AI-generated content. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban researchers for one year for submitting papers with unchecked AI-generated content. 来源
- 2026-05-15 regulatory ArXiv implements a new policy banning researchers for one year for submitting papers with unchecked AI-generated content. 来源
25 天有情绪数据
-
新的深度卷积加速视觉基础模型
研究人员开发了一种通过用高效的深度卷积层替换Vision Transformer (ViT)骨干网络中的某些注意力头来加速视觉基础模型的新方法。这种即插即用的替换方法在图像分类和分割任务上实现了17-20%的推理速度提升,同时性能损失极小。该方法包括识别可替换头的策略以及用于恢复下游任务性能的微调程序,并公开了一个参考实现。
-
新的MRI方法使用扩散模型校正患者运动
研究人员开发了MotionDPS,一个新颖的贝叶斯框架,用于重建因患者运动而损坏的3D脑部MRI扫描。该方法使用预训练的扩散模型作为图像先验,联合估计解剖图像、运动参数和线圈灵敏度图。实验表明,MotionDPS的性能优于现有技术,尤其是在严重运动和高加速情况下,并且无需配对的无运动训练数据即可运行。
-
新型OPERA代理优化图像修复规划与执行
研究人员开发了OPERA,一个新颖的基于代理的框架,旨在优化图像修复过程。与依赖预训练工具且规划有限的先前方法不同,OPERA以端到端的方式联合优化工具组合的规划和这些工具的执行。该方法利用强化学习进行规划优化,并通过代理引导的协同训练来增强工具协作,与现有方法相比,在复杂退化场景下表现更优。
-
GenHAR框架通过域不变学习改进人类活动识别
研究人员开发了GenHAR,一个新框架,通过解决传感器数据中的域偏移来改进人类活动识别(HAR)。GenHAR通过对传感器数据进行分词并分析跨维度的相关性来学习域不变表示,增强了模型的鲁棒性。该框架还纳入了选择性掩码和高效的注意力机制,以提高性能并降低计算负载。在实际测试中,GenHAR比现有方法提高了9.97%的准确率,并被部署用于检测四个城市超过21.5亿次活动。
-
新的VINA框架统一了AI生成图像和视频的检测
研究人员开发了VINA,一个旨在检测AI生成图像和视频的新框架。VINA解决了图像检测模型在应用于视频帧时因压缩和调整大小等处理变化而常常失效的关键限制。通过在图像和视频数据上进行训练并采用跨模态对比目标,VINA提高了在各种基准测试中的检测准确性和鲁棒性。
-
EvoVid框架使视频大语言模型能够利用原始视频数据进行自进化
研究人员推出了一种名为EvoVid的新型框架,旨在通过时间中心自进化来增强视频大语言模型(Video-LLMs)。与以往仅限于静态数据的自进化方法不同,EvoVid通过关注时间动态,使Video-LLMs能够直接从原始、未标注的视频中学习。该框架结合了用于问题生成和视频片段定位的专门奖励,从而在多个基准测试和基础模型上实现了持续的性能提升。
-
新型网络通过先进注意力机制提升立体图像超分辨率
研究人员开发了一种新的多尺度交互网络,旨在增强立体图像超分辨率。该网络旨在更好地利用每个视图内的信息以及立体对之间的信息。它包含一个用于改进视图内特征提取的新型注意力模块,以及另一个用于沿极线进行更准确的跨视图匹配的模块,在与最先进方法相比时表现出具有竞争力的结果。
-
FlexiCT 基础模型推动 CT 成像分析
研究人员开发了 FlexiCT,这是一系列用于计算机断层扫描 (CT) 成像的新型基础模型。这些模型在包含 266,227 个 CT 影像的大型数据集上,使用聚合式持续预训练策略进行训练。FlexiCT 在各种下游任务中表现出色,包括分割、分类和视觉-语言分析,其性能可与现有特定任务模型相媲美或超越。
-
BodyReLux框架实现时间一致性的全身视频重光照
研究人员开发了BodyReLux,一个新颖的框架,它使用基于扩散的方法,在时间一致性的情况下对视频中的全身人类表演进行重光照。该系统在一个结合了传统静态捕捉和动态表演捕捉方法的独特数据集上进行训练。通过利用预训练的文本到视频模型和一种新的基于token的照明条件技术,BodyReLux实现了照片级真实感和鲁棒的视频重光照,能够对照明序列进行动态控制。
-
新理论将自由能原理与自组织神经网络联系起来
研究人员开发了一个新的框架来理解吸引子神经网络如何从自由能原理中涌现。该方法整合了学习和推理动力学,使自组织系统能够执行贝叶斯主动推理。由此产生的网络表现出近似正交化的吸引子表征,这增强了泛化能力以及隐藏原因和可观察效应之间的互信息。
-
新的BSFM框架增强了AI在科学成像中的可靠性
研究人员开发了一个名为贝叶斯随机流匹配(BSFM)的新框架,以提高科学成像中使用的生成模型的可靠性和可解释性。该方法在随机流匹配(SFM)的基础上,通过纳入不确定性量化,实现了在不同实验条件下的更好泛化能力,并能检测不可靠的预测。在细胞成像和fMRI数据上的实验表明,BSFM在实际采样预算内能有效地提供异常分数,用于检测分布外情况。
-
大型语言模型应用于恒星光谱进行参数推断
研究人员开发了一种新颖的两阶段大型语言模型框架,用于分析恒星光谱以进行参数和丰度推断。该方法利用了大型语言模型在自然语言处理和生物序列分析中的泛化能力,来解释恒星光谱中的复杂数据。该模型能够准确估算关键恒星属性,如温度、引力、金属丰度和约20种化学元素的丰度,并且根据规模法则分析表明,随着更多数据的可用,性能会得到提升。
-
通过热力学框架分析AI训练的不可逆性
研究人员开发了一个新的框架来分析AI训练算法的热力学不可逆性。该框架建立了四种不同的不可逆性度量(包括数值后向误差和熵产生)的等价性。研究结果表明,训练算法固有地产生了远离平衡的动力学,从而产生了一种有利于最小化熵产生的学习轨迹的涌现力。
-
量子-经典网络增强动态链接预测
研究人员开发了一个新的混合量子-经典框架 A2QTGN,用于演化网络中的动态链接预测。该模型集成了自适应幅度编码和时序图网络,将节点交互表示为量子态,并选择性地更新嵌入以捕捉重要的结构变化。在基准数据集上的实验表明,A2QTGN 在预测和排序各种动态图中的链接方面非常有效,研究证实了其量子嵌入和自适应更新策略的优势。
-
MetaDNS框架通过元动力学增强离散神经采样器
研究人员推出了一种名为MetaDNS的新型框架,旨在提高离散神经采样器的采样能力。该新方法集成了温和元动力学,以克服模式崩溃和无法探索高能垒区域等限制,这对于自由能估计和理解相变等任务至关重要。MetaDNS已在各种低温基准测试中证明了其有效性,能够准确地重现热力学分布,并显示出与传统基于MCMC的元动力学相当的探索效率。
-
神经网络加速大规模图划分问题
研究人员开发了一种新颖的神经网络方法来加速图划分,这是社交网络分析和VLSI设计等领域中的一项关键任务。该方法用人工神经网络近似取代了计算密集型的Fiedler向量计算,这是谱二分法中的一个关键步骤。新技术保持了与传统谱方法相当的划分质量,同时大大降低了计算开销,从而提高了处理大规模数据集的可扩展性和效率。
-
新方法分解风力发电预测不确定性
研究人员开发了一种新方法,将风力发电预测中的不确定性分解为认知不确定性和随机不确定性。该方法使用贝叶斯后验近似和异方差神经网络回归来区分数据噪声引起的不确定性和模型限制引起的不确定性。提出的评估框架包括合成实验、真实世界数据分析和规模研究,以验证分解的准确性和实用性。
-
ASAP 框架修剪 Vision Transformer 令牌,速度提升 48%
研究人员开发了一个名为 ASAP(Attention Sink Anchored Pruning)的无训练框架,以解决 Vision Transformers (ViTs) 的计算挑战。ASAP 将 ViTs 中的信息流建模为一种懒惰随机游走,识别并利用“注意力汇聚”现象来修剪信息量低的令牌。据报道,该方法在各种视觉任务中将吞吐量加速高达 48%,同时保持或提高了准确性。
-
新机制解释在线分类中的三分之一缩放
研究人员发现了一种边界层机制,该机制解释了在线Softmax分类中的三分之一缩放。该机制表明,只有接近教师决策边界的样本在后期学习中才做出显著贡献。该研究预测测试损失和泛化误差的幂律学习曲线为 \(\\alpha^{-1/3}\\) ,这比贝叶斯最优参考值慢。他们还建议学习率调度可以改善泛化误差,使其趋向 \(\\alpha^{-1/2}\\) 的幂律。
-
新的scFM方法模拟单细胞基因表达动力学
研究人员开发了一个名为单细胞流匹配(scFM)的新框架,以更好地模拟单细胞中基因表达的动力学。该方法解决了现有技术中的挑战,例如离散时间点之间转换的模糊性以及长期预测中的误差累积。通过使用条件流匹配和双向速度场,scFM提高了时间插值和外推的准确性,从而更忠实地重建基因表达动力学。