arXiv
PulseAugur coverage of arXiv — every cluster mentioning arXiv across labs, papers, and developer communities, ranked by signal.
- instance of graph neural networks 95%
- authored by Markov decision processes: a tool for sequential decision making under uncertainty 95%
- instance of reinforcement learning 90%
- instance of federated learning 90%
- authored by stochastic gradient descent 90%
- instance of Vision Language Models 90%
- instance of Multimodal Large Language Models and Tunings: Vision, Language, Sensors, Audio, and Beyond 90%
- instance of Kolmogorov-Arnold Networks 90%
- instance of Pinnschmidt 90%
- authored by GPT-5.1 90%
- developed by muon 90%
- used by SAM2 90%
- 2026-05-26 research_milestone Publication of a research paper detailing a new multi-agent dialog system for industrial asset operations and maintenance. 来源
- 2026-05-20 research_milestone A new paper detailing a two-phase non-parametric retrieval workflow for corporate credit underwriting was published on arXiv. 来源
- 2026-05-18 controversy Controversy over AI-generated articles with fabricated citations on ArXiv. 来源
- 2026-05-17 regulatory arXiv will ban authors for one year if they allow AI to generate their work without significant human oversight. 来源
- 2026-05-16 regulatory ArXiv implements a policy to ban authors for a year if they rely entirely on AI for their submissions. 来源
- 2026-05-16 regulatory ArXiv will ban authors for one year if AI does all the work on their submissions. 来源
- 2026-05-15 regulatory arXiv implements a new policy against AI-generated hallucinations in research papers.
- 2026-05-15 regulatory arXiv is implementing a new policy to ban users who submit AI-generated content with hallucinations. 来源
- 2026-05-15 regulatory arXiv implements a new policy to ban submitters of AI-generated hallucinations. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban authors for one year if their submitted papers show incontrovertible evidence of unchecked AI generation. 来源
- 2026-05-15 regulatory ArXiv implements a new policy banning researchers for one year for submitting AI-generated papers. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban researchers for one year if their submissions contain incontrovertible evidence of unchecked AI-generated content. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban researchers for one year for submitting papers with unchecked AI-generated content. 来源
- 2026-05-15 regulatory ArXiv implements a new policy banning researchers for one year for submitting papers with unchecked AI-generated content. 来源
25 天有情绪数据
-
S3GNN论文介绍用于长距离依赖的高效图学习
研究人员推出S$^3$GNN,这是一种新颖的方法,旨在解决消息传递神经网络(MPNN)中的信息瓶颈问题,该瓶颈阻碍了它们捕获长距离依赖关系的能力。这种新方法在不依赖于限制性理论假设的情况下缓解了信息过度压缩(oversquashing)现象。S$^3$GNN在包括知识图谱问答和流体动力学在内的各种应用中,实现了高达一个数量级的显著误差降低,并且使用了更少的参数,证明了其效率。
-
AI安全研究论文呼吁增加防御激励
arXiv上最近发表的一篇论文强调了AI安全研究中存在的显著不平衡,即对攻击方法的研究远超对防御策略的研究。研究表明,攻击性论文通常在夸大威胁严重性的条件下进行评估,而防御性研究则面临更严格的审查。这种差异导致该领域充斥着漏洞披露,但缺乏实用、可部署的保护措施,因此作者呼吁增加对防御性研究的激励。
-
新方法大幅减少分布式神经网络训练数据交换
研究人员开发了一种名为 Dijkstra-pruned In-Network Learning (D-INL) 的新方法,以提高分布式神经网络训练的效率。该技术通过仅保留最短路径树来修剪通信链路,显著减少了训练期间交换的数据量。该方法还结合了一个有限速率的随机门控,以平衡数据稀疏性和预测信息,进一步降低了估计的潜在速率。
-
新的铰链回归树提供紧凑型表格模型学习
研究人员开发了铰链回归树(HRT)和HRT-Boost,这是一个用于创建紧凑型表格模型的新框架。该方法将斜向分裂优化重新构建为非线性最小二乘问题,从而实现高效的节点级优化。HRT-Boost集成方法通过阶段式函数梯度下降进一步提高了性能,与现有基线相比取得了有竞争力的结果,并产生了更小的模型。
-
研究将舌形与语音声学动力学联系起来
研究人员利用36名英语说话者的超声波舌成像数据,研究了发音策略与声学元音动力学之间的联系。研究发现,在发腭化元音/i/过程中不同的舌形显著预测了双元音的共振峰动力学。这些发现表明,受声道形状影响的发音运动的个体差异,有助于形成独特的语音特征和语音产生的个体性。
-
混合量子-经典模型增强天气降尺度
研究人员开发了一种用于气象降尺度的混合量子-经典扩散模型,将变分量子电路集成到UNet架构中。该方法旨在从粗略输入中增强高分辨率天气数据的重建。初步评估显示,与纯经典模型相比,在平均绝对误差(MAE)和连续排序概率得分(CRPS)方面有所改进,同时保留了大规模空间组织和动能谱。
-
新的图像压缩方法移除熵编码以获得更快的性能
研究人员开发了一种名为EF-LIC的新型学习图像压缩方法,该方法无需传统的熵编码。通过无约束向量量化和上下文条件自回归变换,消除了统计和相关冗余,从而显著降低了编码延迟。实验表明,EF-LIC在实现与现有方法相当的压缩性能的同时,提供了显著的速度提升,编码速度提升超过3倍,解码速度提升5倍。
-
新AI框架借助临床医生反馈辅助呼吸机决策
研究人员开发了一个新的人机协同多智能体框架,称为呼吸机决策支持系统(VDSS),以辅助呼吸机管理。该系统通过结构化接口协调模块化决策组件,从而实现可追溯的证据和特定于临床医生的调整。VDSS使用上下文老虎机偏好学习来实时适应临床医生的偏好,旨在提高推荐的可接受性并减少交互轮次,以实现更稳定且可临床部署的人机协作。
-
DepthAgent 使用多个模型以实现更好的深度估计
研究人员开发了 DepthAgent,这是一种新颖的视觉语言代理,旨在改进各种相机类型的单目深度估计。与使用单一估计器之前的其他方法不同,DepthAgent 利用多个预先存在的深度模型作为工具。它智能地分析场景和相机几何结构,以选择或融合这些专家的预测,尤其是在单个模型表现不佳的挑战性样本上表现出色。这种自适应方法显著提高了深度估计任务的准确性和鲁棒性。
-
论文质疑LLM中下一个词元预测的有效性
一篇新发表在arXiv上的论文探讨了语言模型中下一个词元预测的局限性。文章认为,当前在观察到的序列上训练的模型未能完全捕捉语言生成的条件定律,因为它们忽略了非文本的因素,如意图和上下文。研究表明,为了使下一个词元预测真正有用,观察到的文本必须是这些潜在因素的充分统计量,而异构训练语料库常常不满足这一条件。
-
新的联合训练方法使用特权数据提高机器学习模型准确性
研究人员开发了一种新颖的机器学习模型联合训练方法,该方法利用仅在训练期间可用的特权信息。此方法旨在通过同时学习两个模型来提高预测准确性,从而使部署模型能够选择性地受益于额外的训练数据。在合成数据和真实世界数据上的实验表明,该方法优于传统的两阶段方法,尤其是在特权信息较弱或有噪声的情况下。
-
新的CARE框架改进了AI在嘈杂、不平衡数据上的学习能力
研究人员开发了一个名为CARE的新框架,用于改进在具有不平衡类别分布和嘈杂标签的数据集上训练的机器学习模型。该方法利用视觉-语言模型的洞察力来适应性地纠正错误,对频率较低的类别应用更严格的纠正,对常见类别应用更宽松的纠正。实验表明,CARE比现有技术可以提高高达3.0%的性能。
-
AI 公司使用开放科学数据引发合作与私有化之争
AI 公司广泛使用 arXiv、ORCID 和 PubMed 等开放科学基础设施进行研究。这种做法引发了关于这是否代表真正的合作还是科学知识私有化形式的疑问。文章认为,AI 公司的大量数据提取可能不可持续,并可能损害开放科学生态系统。
-
新的IDEAL框架改进了少样本异常检测
研究人员开发了一个名为IDEAL的新框架,用于判别性少样本异常检测。与仅使用正常参考的先前方法不同,该方法在推理过程中同时利用正常和异常示例作为参考。IDEAL通过首先抑制正常变化,然后将剩余的偏差编码为判别向量来学习内在偏差模式。这使得系统能够泛化到已知和未知的异常,在八个真实世界数据集上优于现有方法。
-
关于手部感知人体网格恢复的研究论文被撤回
一篇题为“DanceHMR: 单目视频中的手部感知全身人体网格恢复”的研究论文被提交到arXiv,提出了一种从单个视频源重建人体运动的新框架。该方法旨在提高整体身体运动的稳定性和手部关节的细节,解决了现有方法在身体连贯性或逐帧准确性方面的局限性。该论文后来被作者Wenhao Shen撤回。
-
无标记步态分析系统可量化儿童运动障碍
研究人员开发了一种新颖的无标记步态分析系统,能够从单视角临床视频中量化步态偏差。该系统估算了Rodda和Graham的膝关节和踝关节z分数,与传统的3D仪器步态分析相比,准确度很高。该技术有望实现可扩展、客观的步态评估,尤其是在资源匮乏的临床环境中,并支持疾病进展和治疗反应的纵向追踪。
-
新的MRI分析使用能量建模进行几何组织追踪
研究人员开发了一种新颖的几何框架,用于分析纵向多参数MRI数据。该方法在序列空间中使用患者特定的能量建模,用其跨多个MRI序列的强度向量表示每个体素。训练一个隐式神经表示来学习一个能量函数,该函数随后描述组织状态,而无需分割标签。
-
InfVSR 通过一步扩散解决长视频超分辨率问题
研究人员推出了一种新颖的视频超分辨率(VSR)方法 InfVSR,旨在克服处理长视频序列的限制。通过将 VSR 重构为自回归一步扩散过程,InfVSR 实现了高效的流式推理并保持了时间一致性。该方法使用因果结构调整了预训练的扩散模型,并将扩散过程提炼为一步,在新的长视频基准测试中实现了显著的加速和质量提升。
-
PartCo框架通过零件级对应先验增强类别发现
研究人员推出PartCo,一个旨在通过整合零件级视觉特征对应来改进泛化类别发现(GCD)的新框架。该方法捕捉更细粒度的语义结构,从而实现对类别关系的更细致理解,这对于区分相似类别至关重要。PartCo与现有的GCD方法集成,并在基准数据集上展示了显著的性能提升,为该领域树立了新标准。
-
NoPo4D 从无姿态多视角视频重建动态3D场景
研究人员开发了NoPo4D,一种新颖的前馈系统,能够从多视角视频中重建动态3D场景,而无需已知的相机姿态。该系统将高斯运动分解为图像平面位移和深度变化,从而可以直接从光流进行监督。这种方法绕过了对与姿态精度或3D运动真实情况相关的可微分渲染的需求,其性能优于现有的前馈方法,甚至能与每场景优化技术相媲美,同时速度显著更快。