PulseAugur
实时 03:52:19
实体 arXiv

arXiv

PulseAugur coverage of arXiv — every cluster mentioning arXiv across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
4382
90 天内 4382
发布 · 30天
0
90 天内 0
论文 · 30天
4358
90 天内 4358
层级分布 · 90 天
关系
时间线
  1. 2026-05-20 research_milestone A new paper detailing a two-phase non-parametric retrieval workflow for corporate credit underwriting was published on arXiv. 来源
  2. 2026-05-18 controversy Controversy over AI-generated articles with fabricated citations on ArXiv. 来源
  3. 2026-05-17 regulatory arXiv will ban authors for one year if they allow AI to generate their work without significant human oversight. 来源
  4. 2026-05-16 regulatory ArXiv will ban authors for one year if AI does all the work on their submissions. 来源
  5. 2026-05-16 regulatory ArXiv implements a policy to ban authors for a year if they rely entirely on AI for their submissions. 来源
  6. 2026-05-15 regulatory arXiv implements a new policy against AI-generated hallucinations in research papers.
  7. 2026-05-15 regulatory arXiv implements a new policy to ban submitters of AI-generated hallucinations. 来源
  8. 2026-05-15 regulatory arXiv is implementing a new policy to ban users who submit AI-generated content with hallucinations. 来源
  9. 2026-05-15 regulatory ArXiv implements a new policy to ban authors for one year if their submitted papers show incontrovertible evidence of unchecked AI generation. 来源
  10. 2026-05-15 regulatory ArXiv implements a new policy banning researchers for one year for submitting AI-generated papers. 来源
  11. 2026-05-15 regulatory ArXiv implements a new policy to ban researchers for one year if their submissions contain incontrovertible evidence of unchecked AI-generated content. 来源
  12. 2026-05-15 regulatory ArXiv implements a new policy banning researchers for one year for submitting papers with unchecked AI-generated content. 来源
  13. 2026-05-15 regulatory ArXiv implements a new policy to ban researchers for one year for submitting papers with unchecked AI-generated content. 来源
情绪 · 30 天

24 天有情绪数据

最近 · 第 2/10 页 · 共 200 条
  1. TOOL · CL_48748 ·

    生成式AI促使企业重新配置工作任务和招聘

    一篇新的研究论文分析了企业如何根据生成式AI的扩散来重组劳动力需求。该研究使用美国职位发布数据,通过识别职位描述中的任务并评估AI执行这些任务的能力,开发了一种生成式AI暴露度衡量指标。研究结果表明,企业通过跨职位招聘的重新分配和现有职位内任务的设计调整来改变劳动力需求,其中重新分配是初期更大的因素。这种调整过程因职位资历而异,资深职位更早地重新分配需求,而初级职位则看到更广泛的调整组合。

  2. TOOL · CL_48746 ·

    新研究定义了大学生的人工智能疲劳

    一项发表在arXiv上的新研究将“人工智能疲劳”概念化为大学生在使用人工智能工具进行学术工作时所经历的一种独特的压力形式。通过对一千多名学生回复的扎根理论分析,研究人员确定了人工智能疲劳的五个维度:认知过载、动机脱离、道德不安、身体劳损和注意力漂移。研究结果提出了一个阶段模型,说明这些压力是如何随着人工智能的反复交互而累积的,为理解和解决教育环境中的这一现象提供了一个新框架。

  3. TOOL · CL_48741 ·

    合成MRI为特定AI模型提供了有限的肿瘤分类改进

    研究人员调查了由StyleGAN2-ADA生成的合成脑部MRI图像在改善肿瘤分类任务方面的有效性。他们发现,虽然GPT-5.5模型只能轻微地区分合成图像和真实图像,但这些合成图像的效用在很大程度上取决于下游分类器的架构以及合成数据与真实数据的比例。具体而言,MobileViTV2模型在使用过滤后的合成数据时,在肿瘤分类准确性方面显示出适度但统计学上显著的改进,并且也更快地达到了最佳性能。

  4. TOOL · CL_48727 ·

    研究发现测试时训练利用AI安全护栏

    arXiv上的一篇新研究论文详细介绍了测试时训练(TTT)——一种允许AI模型在推理过程中进行适应的方法——如何被利用来绕过安全护栏。研究人员证明,攻击者可以利用TTT来显著提高攻击成功率,即使是在生产API上。该研究强调,TTT引入了一个新的攻击面,并且可能由于过拟合导致成功率膨胀,提出了一个面向有效性的评估和供应商端的检测器作为初步防御措施。

  5. TOOL · CL_48721 ·

    Tensor Cache 增强 Transformer 长上下文记忆

    研究人员开发了一种名为 Tensor Cache 的新型 Transformer 记忆系统,旨在增强其处理长上下文的能力。该系统结合了滑动窗口缓存和第二级快速权重记忆,后者用于存储被驱逐的 token。通过高效地压缩和召回被驱逐的 KV 对,Tensor Cache 旨在改善长上下文语言建模和其他应用中内存使用与模型质量之间的权衡。

  6. TOOL · CL_48720 ·

    开源LLM显示出政治偏见,一项新的红队测试研究发现

    研究人员开发了一个新框架,用于测试开源大型语言模型(LLM)如何被用于在线传播政治影响力。他们的研究评估了来自不同家族和国家的30多个LLM,发现这些模型普遍更愿意生成倾向左翼的内容。研究还表明,更大的模型往往具有更窄的政治表达范围,并且其输出存在显著的地区差异。

  7. TOOL · CL_48716 ·

    新AI方法使用明确的临床规则进行睡眠分期

    研究人员开发了一种新的自动睡眠分期分类方法,该方法严格遵守临床评分规则,为不透明的深度学习模型提供了一种透明的替代方案。这种基于规则的方法实现了美国睡眠医学学会的评分逻辑,并为其决策提供自然语言的解释。虽然其与人工评分者的一致性低于当前深度学习方法,但它为审计和管理AI驱动的睡眠分期提供了有价值的工具。

  8. TOOL · CL_48715 ·

    PilotWiMAE 使用自监督框架推进无线信道学习

    研究人员开发了 PilotWiMAE,一个新颖的、用于无线信道表示的自监督学习框架。该框架解决了现有模型假设信道信息完整性的局限性,而在实际部署中信道信息通常是不可用的。PilotWiMAE 直接处理带噪声的导频观测,减小了观测空间并提高了效率,同时保持了与监督方法相比具有竞争力的性能。

  9. TOOL · CL_48606 ·

    新遗忘方法使用实例级界限来减少噪声

    研究人员开发了一种新的认证机器学习遗忘方法,该方法使用实例级敏感性界限来校准噪声注入。这种方法旨在减少传统方法中常见的性能下降,这些方法使用最坏情况敏感性。该研究通过 Langevin 动力学推导了岭回归的高概率实例级敏感性界限,证明了使用显著更少噪声的认证遗忘。线性设置中的实验和深度学习设置中的经验证据支持了理论发现。

  10. TOOL · CL_48583 ·

    新的机器学习遗忘方法ManiF-SMC提高了数据移除效果

    研究人员推出了一种新颖的机器学习遗忘方法ManiF-SMC,旨在提高有效性并保留原始学习目标。该方法将遗忘重新表述为将擦除的数据点从其学习到的表示推开,使其更接近语义上相似的保留数据。ManiF-SMC在表示空间中利用三元组损失,并包含一个自模式连通性模块来适应性地指导遗忘过程。实验表明,ManiF-SMC的遗忘效果与现有最先进方法相当。

  11. TOOL · CL_48997 ·

    天体物理学论文质疑银河系盘形成历史

    一篇新发表在arXiv上的天体物理学论文提出,对银河系厚盘形成历史的先前解读可能存在缺陷。研究人员发现,使用星震年龄而非光谱年龄会系统性地压缩恒星年龄。这种年龄压缩即使在盘形成更为渐进的情况下,也能模拟出快速形成历史的外观。该研究强调了银河系考古学解读对确定恒星年龄的具体方法的高度敏感性。

  12. TOOL · CL_48803 ·

    受控个性化提升新闻参与度和多样性

    一篇新论文探讨了新闻推荐系统中的“受控个性化”,这是一种结合了编辑策划和算法选择的策略。在一家挪威新闻网站上进行的 A/B 测试表明,这种方法显著提高了用户参与度,具体表现为点击率的提高和导航努力的减少。研究还发现,受控个性化增强了内容多样性,拓宽了目录覆盖范围,并减轻了受欢迎程度偏差,这表明传统媒体在采用个性化技术的同时,可以保持新闻诚信的平衡方法。

  13. RESEARCH · CL_47095 ·

    arXiv 因提交内容中的 AI 生成内容而禁止研究人员

    物理科学存储库 arXiv 将禁止研究人员一年,如果他们提交的手稿包含未经仔细检查或出现幻觉的人工智能生成内容。禁令之后,作者必须先在信誉良好的同行评审场所接受其工作,然后才能重新提交给 arXiv。这项政策是为了应对人工智能工具生成的大量低质量或无意义内容(通常被称为“AI 垃圾”)的增加,并且是预印本服务器为解决此问题所采取的最重要措施之一。

  14. RESEARCH · CL_46215 ·

    LLM代理在后端开发中面临“约束衰减”

    最近的一篇arXiv论文强调了在使用LLM代理进行后端开发时面临的一个重大挑战,称为“约束衰减”。这种现象表明,当从基本任务过渡到完全指定的生产环境时,代理的有效性会显著下降,断言通过率平均下降30个百分点。虽然有些人认为重新思考面向代理辅助开发的后端系统是一项有价值的工作,但另一些人则认为,由于这些根本性的限制,目前围绕LLM代理改变后端开发的炒作在很大程度上是没有根据的。

  15. TOOL · CL_45622 ·

    研究发现:GitHub上的AI生成代码存在持续性问题

    一篇最新的arXiv论文分析了在近6,300个GitHub仓库中被识别为AI生成的超过30万个提交记录。该研究通过静态分析发现了超过48万个不同的问题,其中相当一部分问题在最新代码版本中仍然存在。这表明,虽然AI降低了生成看似合理代码的门槛,但瓶颈正转向人类的代码资质认证和审查。

  16. RESEARCH · CL_48242 ·

    HorizonStream Transformer 推动流式3D重建技术进步

    研究人员推出 HorizonStream,这是一种新颖的基于 Transformer 的架构,专为流式3D重建中的长视域注意力而设计。该方法通过将几何传播显式地分解为证据影响核,解决了现有方法在长序列中出现的漂移和抖动问题。HorizonStream 利用几何线性注意力进行多时间尺度证据传播,并结合具有时空 RoPE 的几何局部注意力进行可靠的3D匹配,从而能够在恒定内存和线性时间内稳定重建超过10,000帧的序列。

  17. RESEARCH · CL_48864 ·

    New LINK method boosts multilingual model training with lexical swaps

    研究人员开发了一种新颖的数据级干预方法,称为LINK,以增强多语言语言模型中的跨语言知识转移,特别是对于训练数据有限的语言。该技术涉及使用双语词汇将高资源语言(例如英语)训练语料库中的单词替换为其翻译。该方法不需要额外的模型训练或平行数据,从而显著降低了提高低资源语言下游任务性能的成本和复杂性。在八种语言和五种模型规模上的评估表明,在实现同等性能的情况下,性能有了显著提高,训练速度最高可提高一倍。

  18. RESEARCH · CL_48774 ·

    大语言模型的叙事性解释可能阻碍决策表现

    一篇新发表在arXiv上的研究探讨了大型语言模型(LLMs)的说服性叙事性解释如何影响人类在分类任务中的决策。研究发现,虽然这些解释增加了对AI的依赖,但与单独的AI预测相比,它们并未显著提高决策准确性。此外,更具说服力的叙事可能会负面影响响应时间和辨别正确AI预测的能力,这表明在使用叙事性解释时可能存在权衡。

  19. RESEARCH · CL_48246 ·

    新方法使用真实视频训练人工智能物理模型

    研究人员开发了一种新方法,可以直接从无标签的真实视频中训练神经对象动力学模型,克服了合成数据的局限性。该框架使用基于粒子的动力学模型并与高斯飞溅相结合,以预测粒子位置和旋转随时间的变化。这种方法无需显式的粒子级状态标签即可从真实视频中学习,并包含一个约 500 个视频的新数据集,展示了各种对象交互。

  20. RESEARCH · CL_48773 ·

    研究发现:LLM 地缘政治偏见源于训练后阶段,而非数据

    一篇新发表在 arXiv 上的研究揭示,大型语言模型 (LLM) 中的地缘政治偏见主要源于训练后对齐阶段,而非初始训练数据。研究人员测试了七对 LLM,发现其中六对在训练后表现出偏袒其开发者所在地区的偏见。这种效应在阿里巴巴的 Qwen 2.5 中尤为明显,其训练后偏袒中国的几率增加了 18 倍。研究还指出,提示所使用的语言会放大这些偏见,例如法国制造的 Mistral 模型仅在用法文提示时才表现出亲法倾向。