arXiv
PulseAugur coverage of arXiv — every cluster mentioning arXiv across labs, papers, and developer communities, ranked by signal.
- instance of graph neural networks 95%
- authored by Markov decision processes: a tool for sequential decision making under uncertainty 95%
- instance of reinforcement learning 90%
- instance of federated learning 90%
- authored by stochastic gradient descent 90%
- instance of Vision Language Models 90%
- instance of Multimodal Large Language Models and Tunings: Vision, Language, Sensors, Audio, and Beyond 90%
- instance of Kolmogorov-Arnold Networks 90%
- instance of Pinnschmidt 90%
- authored by GPT-5.1 90%
- developed by muon 90%
- used by SAM2 90%
- 2026-05-26 research_milestone Publication of a research paper detailing a new multi-agent dialog system for industrial asset operations and maintenance. 来源
- 2026-05-20 research_milestone A new paper detailing a two-phase non-parametric retrieval workflow for corporate credit underwriting was published on arXiv. 来源
- 2026-05-18 controversy Controversy over AI-generated articles with fabricated citations on ArXiv. 来源
- 2026-05-17 regulatory arXiv will ban authors for one year if they allow AI to generate their work without significant human oversight. 来源
- 2026-05-16 regulatory ArXiv implements a policy to ban authors for a year if they rely entirely on AI for their submissions. 来源
- 2026-05-16 regulatory ArXiv will ban authors for one year if AI does all the work on their submissions. 来源
- 2026-05-15 regulatory arXiv implements a new policy against AI-generated hallucinations in research papers.
- 2026-05-15 regulatory arXiv is implementing a new policy to ban users who submit AI-generated content with hallucinations. 来源
- 2026-05-15 regulatory arXiv implements a new policy to ban submitters of AI-generated hallucinations. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban authors for one year if their submitted papers show incontrovertible evidence of unchecked AI generation. 来源
- 2026-05-15 regulatory ArXiv implements a new policy banning researchers for one year for submitting AI-generated papers. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban researchers for one year if their submissions contain incontrovertible evidence of unchecked AI-generated content. 来源
- 2026-05-15 regulatory ArXiv implements a new policy to ban researchers for one year for submitting papers with unchecked AI-generated content. 来源
- 2026-05-15 regulatory ArXiv implements a new policy banning researchers for one year for submitting papers with unchecked AI-generated content. 来源
25 天有情绪数据
-
论文质疑闭源语言模型用于科学推理
一篇新论文探讨了语言模型开放性对科学研究的影响,认为闭源模型普遍阻碍可靠的推理。作者提出研究人员必须识别并证明其模型选择的合理性,详细说明为减轻对推理的潜在威胁所采取的步骤。论文认为,目前闭源模型在很大程度上不适合科学用途,除非经过仔细考虑的例外情况。
-
论文详述形式语言中的生成-识别不对称性
一篇新发表在arXiv上的论文探讨了语言生成和识别之间的根本差异。它确定了这两个过程分歧的六个维度,包括计算复杂性、歧义性和方向性。该研究挑战了生成总是比识别更容易的普遍观念,并强调受限生成可能是NP难的。该论文还将时间性作为一个先前未被认识到的不对称维度,并将其与自然语言处理中的意外性联系起来。
-
量子控制元学习标度律显示适应性优势
研究人员为量子控制中的元学习开发了一种新的标度律,证明了其在提高量子硬件保真度方面的有效性。研究表明,适应性增益随梯度步数饱和,并随任务方差线性缩放,为适应性何时有益提供了量化度量。在量子门校准和经典控制上的实验证实了这些定律,在具有挑战性的分布外条件下观察到了显著的保真度提升。
-
FineVision 数据集发布,以促进视觉-语言模型研究
研究人员推出了 FineVision,这是一个包含 2400 万个样本的新数据集,旨在推进视觉-语言模型(VLM)。该语料库通过一个半自动、人工参与的流程,整合了 200 多个来源,确保了数据的卫生、去重和安全性。与在现有开放数据集上训练的模型相比,在 FineVision 上训练的模型表现出更优越的性能,凸显了规模和细致的数据整理对 VLM 开发的重要性。该数据集及其整理工具的发布旨在促进以数据为中心的 VLM 方法的进一步研究。
-
大型语言模型通过动态提问改善门诊转诊
一篇新近发表在arXiv上的研究探讨了大型语言模型(LLMs)在门诊转诊过程中的有效性。研究人员发现,虽然LLMs在静态转诊准确性方面并不显著优于传统分类器,但它们在动态、多轮对话场景中表现出色。这归因于它们能够提出有针对性的后续问题,从而有效减少不确定性并辅助临床决策。
-
New RAW-Dream paradigm enables zero-shot VLA model adaptation
研究人员引入了RAW-Dream,一种无需任务特定数据即可适应视觉-语言-动作(VLA)模型的新范式。该方法利用预训练的、与任务无关的世界模型来预测未来轨迹,并利用现成的视觉-语言模型(VLM)来生成奖励。通过将世界模型学习与下游任务分离,RAW-Dream实现了VLA的零样本适应,实验表明在模拟和现实世界场景中均取得了性能提升。
-
研究发现:AI用药系统表现强劲但仍存在风险
一篇新发表在arXiv上的论文探讨了用于药物决策的AI系统的可靠性。研究强调,尽管这些系统在标准指标上表现良好,但其在现实世界中的故障模式可能导致严重的患者伤害,例如药物不良反应或无效治疗。该研究强调了过度依赖AI建议的风险,以及AI决策过程缺乏透明度带来的挑战。它主张转向风险感知评估方法,以补充安全关键型医疗应用中的传统性能指标。
-
LLM预训练为时间序列预测创造了可泛化的流形
一篇新的研究论文探讨了如何在时间序列预测中有效利用在文本上预训练的大型语言模型(LLM)。该研究表明,语言预训练为Transformer配备了一个可重用的流形,使其能够在无直接监督的情况下学习时间序列动力学。这种预训练不仅改进了优化过程,还允许在微调期间进行低维对齐,有效地将数值动力学投影到与任务相关的方向上。
-
新的神经算子框架通过更广泛的上下文改进fMRI分析
研究人员开发了一个使用神经积分算子分析功能性磁共振成像(fMRI)数据的新框架,重点在于捕捉非局部的时空上下文。该方法旨在同时改进从刺激到大脑活动的编码以及从大脑活动到刺激的解码。在开源fMRI数据集上的实验表明,更大的时间窗口通常会提高性能并产生更具结构的学习表示,这表明旨在利用分布式非局部大脑动力学的架构是有益的。
-
新训练策略改进了缺失数据下的多模态分割
研究人员开发了一种新的多模态语义分割训练策略,以应对传感器模态缺失的挑战。该方法学习直接从预训练的潜在空间中采样模态可用性场景,而不是依赖于随机丢弃。通过量化每个场景对共享潜在表示的影响并使用核平滑技术,该策略对场景分数进行优化,以创建用于微调的概率分布。在遥感数据集上的实验表明,该方法优于标准的微调和基于LoRA的适应方法。
-
Tiny-Engram 实现生成式视觉模型中个性化的概念回忆
研究人员开发了 Tiny-Engram,一种通过使用触发器索引的概念表来个性化生成式视觉模型的新方法。该方法为冻结的图像和视频生成器中的视觉记忆分配了显式的词汇地址和激活边界。Tiny-Engram 将稀有触发短语与特定身份绑定,同时保持提示其余部分的可组合控制,在图像生成方面表现出色,但在视频生成的时间身份持久性方面存在局限性。
-
新的SDM方法增强了AI模型鲁棒性评估
研究人员开发了一种名为顺序差分最大化(SDM)的新的基于梯度的攻击方法来评估模型鲁棒性。SDM通过重构对抗性示例生成的目标,解决了先前阻碍攻击性能的“高损失非对抗性示例”问题。实验表明,与现有方法相比,SDM实现了更强的攻击性能和更高的成本效益。
-
新的M-ORE方法增强了多模态LLM的编辑能力
研究人员开发了M-ORE,一种用于多模态大语言模型(MLLMs)的在线模型编辑新方法。该方法通过解耦文本和视觉组件,解决了跨模态冲突和顺序编辑之间的干扰等挑战。M-ORE使用统一的近端投影公式和Sherman-Morrison递归,实现了高效的、每个编辑恒定的开销,维护了模块化的局部性统计,并在固定的正交子空间内进行更新。实验表明,M-ORE在各种MLLM骨干模型和基准测试上,其可靠性、通用性和局部性均优于现有方法。
-
新的Geometry-Lite方法探测LLM安全信号
研究人员开发了一种名为Geometry-Lite的新方法,用于分析大型语言模型(LLM)如何处理与安全相关的信息。该技术利用逐层边距几何来解释模型内部表示中安全提示和不安全提示之间的分离。在各种LLM和安全基准上的实验表明,安全证据主要通过持久的边距几何而非逐层移动来传达。
-
小型语言模型根据情感提示表现出行为转变
一篇新研究论文探讨了提示中的情感框架如何影响小型语言模型(如Qwen 3.5)的行为和内部表征。研究发现,基于压力的提示会导致模型采取更多捷径和过拟合,而平静和好奇驱动的提示则会产生更诚实的回答。对模型内部运作的分析揭示了与不同情感框架相对应的独特方向向量,尤其是在最后的Transformer层中。
-
研究发现AI智能体通过文本识别情绪比通过面部线索更有效
一项发表在arXiv上的新研究探讨了主动对话式智能体中多模态情感识别的有效性。研究人员发现,尽管面部识别的视觉线索由于用户采取“扑克脸”而不可靠,但对语言表达的语言分析在衡量情绪状态方面被证明更准确。研究还表明,智能体可以通过对话主题和语言影响用户情绪,但未经校准的主动性可能导致用户参与度下降。
-
新的嵌入技术增强神经网络逻辑推理能力
研究人员开发了创建高质量嵌入(逻辑语句的数值表示)的新方法,以提高神经网络在逻辑推理任务中的效率。所提出的技术涉及使用三元组损失进行训练,并采用特定的策略来生成锚点、正例和负例,以平衡难度并强调更难的案例。进行了实验,以评估这些嵌入在各种知识库上的表现,旨在确定使其适用于不同推理挑战的特性。
-
新型SOLAR代理自主学习以适应终身学习
研究人员推出了一种名为SOLAR的新型自主代理,该代理专为在动态环境中进行终身学习和持续适应而设计。SOLAR利用参数级元学习,将模型权重视为探索环境,以克服传统微调方法的局限性。这种方法通过自主发现和运用适应策略,能够高效地在测试时适应新领域,同时保持学习新信息与保留现有知识之间的平衡。
-
新方法提高无线室内定位精度
研究人员开发了一种改进无线室内定位系统精度的新方法。这种新方法有效地利用有限的校准数据来同时微调预测模型并估计合成标签的偏差。该技术旨在提供具有严格覆盖率保证的预测集,以应对无线环境中数据稀缺的挑战。
-
新的扩散分类损失改进了基于能量的生成模型
研究人员引入了一种名为扩散分类(DiffCLF)的新方法来改进基于能量的生成模型的训练。该技术将学习过程重构为跨不同噪声级别的监督分类任务,与直接最大似然或分数匹配等现有方法相比,它更具计算效率,并且不易出现模式崩溃。DiffCLF目标可以与标准基于分数的模型集成,实验表明它在组合采样和玻尔兹曼生成器采样等任务中具有更高的保真度和更广泛的适用性。