arXiv
PulseAugur coverage of arXiv — every cluster mentioning arXiv across labs, papers, and developer communities, ranked by signal.
- instance of graph neural networks 95%
- authored by Markov decision processes: a tool for sequential decision making under uncertainty 95%
- instance of reinforcement learning 90%
- instance of federated learning 90%
- authored by stochastic gradient descent 90%
- instance of Vision Language Models 90%
- instance of Multimodal Large Language Models and Tunings: Vision, Language, Sensors, Audio, and Beyond 90%
- instance of Kolmogorov-Arnold Networks 90%
- instance of Pinnschmidt 90%
- authored by GPT-5.1 90%
- developed by muon 90%
- used by SAM2 90%
- 2026-05-26 research_milestone Publication of a research paper detailing a new multi-agent dialog system for industrial asset operations and maintenance. 来源
- 2026-05-20 research_milestone A new paper detailing a two-phase non-parametric retrieval workflow for corporate credit underwriting was published on arXiv. 来源
- 2026-05-18 controversy Controversy over AI-generated articles with fabricated citations on ArXiv. 来源
- 2026-05-17 regulatory arXiv will ban authors for one year if they allow AI to generate their work without significant human oversight. 来源
- 2026-05-16 regulatory ArXiv implements a policy to ban authors for a year if they rely entirely on AI for their submissions. 来源
- 2026-05-16 regulatory ArXiv will ban authors for one year if AI does all the work on their submissions. 来源
- 2026-05-15 regulatory arXiv implements a new policy against AI-generated hallucinations in research papers.
- 2026-05-15 regulatory arXiv is implementing a new policy to ban users who submit AI-generated content with hallucinations. 来源
- 2026-05-15 regulatory arXiv implements a new policy to ban submitters of AI-generated hallucinations. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban authors for one year if their submitted papers show incontrovertible evidence of unchecked AI generation. 来源
- 2026-05-15 regulatory ArXiv implements a new policy banning researchers for one year for submitting AI-generated papers. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban researchers for one year if their submissions contain incontrovertible evidence of unchecked AI-generated content. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban researchers for one year for submitting papers with unchecked AI-generated content. 来源
- 2026-05-15 regulatory ArXiv implements a new policy banning researchers for one year for submitting papers with unchecked AI-generated content. 来源
25 天有情绪数据
-
研究证明在共线性下特征排名不可能
一篇新发表在arXiv上的研究论文表明,当特征共线性时,没有任何特征排名方法能够同时做到忠实、稳定和完整。该研究证明了这种不可能,并针对各种模型类别进行了量化,表明像DASH这样的集成平均方法可以解决这个问题。这些发现对公平性审计有直接影响,表明基于SHAP的代理歧视审计在共线性下是不可靠的。
-
新框架通过选择关键帧改进视频编辑
研究人员开发了一个新的鲁棒视频编辑框架,以应对遮挡、视角变化和快速物体运动带来的挑战。该方法侧重于通过评估结构完整性、跟踪稳定性和语义清晰度来选择最优锚定帧。这种方法将遮挡处理从显式重建转变为可靠的锚定帧选择,从而无需手动标注即可实现精确且时间一致的编辑。
-
新方法优化提示嵌入以增强上下文学习
研究人员开发了一种新颖的方法,通过在测试时优化提示嵌入来增强AI模型中的上下文学习(ICL)。该技术利用模型自身演示输出的对数概率作为一种自监督置信度代理。通过最大化此代理,系统无需微调或外部数据即可进行校准,在各种ICL任务中表现出一致或改进的性能。
-
VLMs通过提高地图覆盖率来增强机器人探索能力
研究人员开发了一种新的自主机器人探索方法,该方法使用视觉语言模型(VLM)进行高级决策。VLM分析多模态提示,包括地图和潜在路径的视觉数据,以选择最有希望的探索前沿。该方法在六个环境的模拟中进行了测试,与现有方法相比,地图覆盖率提高了24%。该流程设计轻量级,无需额外训练,并且易于适应具有标准传感器和互联网连接的机器人。
-
新框架确立了任意维度机器学习模型的普适性
研究人员开发了一个新颖的框架,用于理解和确立适用于任意尺寸输入(如图或点云)的机器学习模型的普适性。该方法涉及将任意维度的函数映射到无限维度极限空间中的一个唯一函数。研究表明,某些现有架构缺乏普适性,并提出了修改以恢复此属性。
-
新的凸混合建模方法增强了可解释性
研究人员开发了一种新的混合建模方法,该方法将机器学习的准确性与决策系统所需的解释性相结合。该方法将凸学习问题形式化,以系统地考虑可解释性,提供高效的代理模型。该方法利用算子理论在“提升”空间中重新参数化模型,将系统视为可解释模型基于核的混合体,并在静态和动态模型中展示了应用。
-
大型语言模型在精神科筛查中表现不一,需要验证
一项发表在arXiv上的新研究评估了五种大型语言模型在精神科筛查中的表现,使用了包含555次访谈的基准。模型表现出不同的准确性,其中GPT-4.1 Mini和GPT-5 Mini显示出最一致的结果。研究人员发现,当患者报告功能完好或有社会支持时,大型语言模型倾向于低估症状证据,这凸显了在临床使用前需要进行仔细验证。
-
新研究通过移动模式和指标不一致来解决人工智能公平性问题
研究人员正在探索评估机器学习模型公平性的新方法,超越传统的基于群体的指标。一篇论文提出了一种新颖的方法来评估空间公平性,通过考虑个体在不同区域的移动模式,而不仅仅是他们的静态位置。另一项研究强调了当前公平性评估的不可靠性,展示了不同的指标如何得出关于模型偏差的矛盾结论,并引入了公平性不一致指数来量化这种不一致性。第三篇论文则专注于通过开发一种学习个体之间相似性度量的算法来操作化个体公平性,这对于确保人工智能系统以相似的方式对待相似的个体至关重要。
-
新框架ASASR提高了图像超分辨率的保真度
研究人员开发了一个名为ASASR的新框架,用于图像超分辨率,旨在提高生成图像的保真度。该方法通过将生成流重塑为Sobolev诱导的黎曼几何来解决当前生成模型中的光谱失真问题。ASASR使用参数化对抗器来合成目标负样本,指导优化以保持光谱一致性和结构保真度,从而减少伪影。
-
HorizonStream Transformer 推动流式3D重建技术发展
研究人员推出 HorizonStream,这是一种新颖的基于 Transformer 的架构,专为流式3D重建中的长视域注意力而设计。该方法通过将几何传播显式地分解为证据影响核,解决了现有方法在长序列中出现的漂移和抖动问题。HorizonStream 利用几何线性注意力进行多时间尺度证据传播,并结合具有时空 RoPE 的几何局部注意力进行可靠的3D匹配,从而能够在恒定内存和线性时间内稳定重建超过10,000帧的序列。
-
Geo-Align 框架通过 RL 增强视频重渲染
研究人员开发了 Geo-Align,一个用于相机控制视频重渲染的新型强化学习框架。该方法解决了现有方法依赖合成数据且难以泛化到真实世界视频的局限性。Geo-Align 利用了尺度感知感知奖励机制和度量 3D 估计器,以确保精确的相机轨迹提取和物理尺度的遵守,在可控性和视觉保真度方面优于监督学习基线。
-
PiD解码器通过像素扩散加速高分辨率图像生成
研究人员开发了PiD,一种新颖的像素扩散解码器,可显著提高图像生成的质量和速度。这种新方法将潜在解码重新构建为条件像素扩散过程,从而能够更快、更详细地合成高分辨率图像。PiD可以集成到现有的文本到图像系统中,在视觉保真度和计算效率方面都提供了实质性的改进。
-
研究揭示模型生成的代理技能效用参半
研究人员对模型生成代理技能的生命周期进行了系统研究,涵盖了从经验生成到技能消费的整个过程。他们的发现表明,虽然这些技能通常能提高代理性能,但也可能导致负迁移,即在某些情况下反而会阻碍性能。研究强调,模型作为技能提取器的有效性与其作为技能消费者的能力不一定相关,并且技能的效用并非完全取决于模型规模。
-
GenRecon 利用生成式先验推动三维场景重建
研究人员开发了 GenRecon,一种将生成式三维先验与多视图图像条件相结合的新型三维场景重建方法。该方法将场景重建视为在局部块上进行条件式三维生成,从而能够继承 Trellis.2 等最先进的生成式形状模型的保真度。该方法实现了高保真、多视图一致的几何和可编辑的 PBR 网格重建,性能比现有方法提高了 16%。此外,一个用于自动驾驶的新框架利用映射先验来改进三维物体检测,在 Waymo Open Dataset 上取得了最先进的成果。
-
ETCHR模型通过解耦图像编辑提升MLLM视觉推理能力
研究人员开发了ETCHR,一种旨在增强多模态大语言模型(MLLM)视觉推理能力的新型图像编辑模型。ETCHR将图像编辑与语言理解解耦,采用两阶段训练过程来改进MLLM解释和操作视觉信息的方式。当与Qwen3-VL-8B、Gemini-3.1-Flash-Lite和Kimi K2.5等模型集成时,这种方法在各种视觉推理任务上都显示出显著的性能提升。
-
BERTopic在分析短篇调查回复方面优于STM
一篇新论文比较了两种主题建模方法——结构主题模型(STM)和BERTopic——在分析短篇、开放式调查回复中的应用。研究发现,BERTopic通常能产生更连贯、更易于解释的主题,尤其是在使用一种新颖的上下文增强策略时。虽然STM在协变量分析方面提供了更强的推断能力,但BERTopic提供了更具描述性的比较,表明这两种方法在社会科学研究中具有互补的优势。
-
KANs 推动生存分析,提出新型深度学习模型
研究人员开发了 KAPLAN-HR,一种基于 Kolmogorov-Arnold Networks (KANs) 的新型深度学习模型,用于生存分析。该模型可以估计协变量和时间的联合函数作为条件风险率,克服了传统方法需要手动指定复杂效应的局限性。在六个临床数据集上的评估表明,KAPLAN-HR 的性能与现有的统计和深度学习生存分析技术相当或更优。
-
新的GEMQ方法优化MoE LLM的内存和速度
研究人员开发了GEMQ,一种专为混合专家(MoE)大型语言模型(LLM)设计的混合精度量化新方法。该方法通过根据各个专家的重要性智能分配比特宽度,来解决MoE模型显著的内存开销问题。GEMQ利用全局线性规划方法进行重要性估计,并包含路由器微调以适应量化后的专家,从而在最小的精度损失下减少内存使用并加快推理速度。
-
研究表明训练数据课程能微调强化学习代理的专业化
arXiv上的一项新研究探讨了不同的训练数据课程如何影响旨在与大型语言模型(LLM)和外部记忆库协同工作的强化学习(RL)代理的性能。研究发现,训练数据的构成显著影响代理的专业化,而非普遍提升性能。结合不同基准的混合课程产生了最佳的总体结果,而仅在狭窄的域外数据集上训练则特别提高了时间推理能力。
-
新的优化器SF-NorMuon在没有计划的情况下也能达到AdamW的性能
研究人员开发了SF-NorMuon,这是一种新的无计划谱优化器,其性能可与传统的AdamW优化器相媲美或超越。这一进展解决了当前随时随地训练方法的一个关键限制,即无计划的方法通常表现不佳。SF-NorMuon能够在没有预定义时间范围的情况下,在任何时候实现高质量的训练检查点,使其成为开放式持续学习的更实用的工具。