Hugging Face
Hugging Face is one of the entities PulseAugur tracks across the AI industry. This page surfaces every recent cluster mentioning Hugging Face — vendor announcements, third-party press, social commentary, research papers, and regulatory filings — ranked by signal across our 200+ source set. Linked to the canonical entity record on Wikipedia and Wikidata so the entity card AI engines build is grounded in the same identity Wikipedia uses, not a slug-collision lookalike.
- acquired Gradio 95%
- partners with NVIDIA 90%
- partners with Intel 90%
- founded Liang Wenfeng 90%
- instance of Qwen3.6-27B 90%
- partners with llama.cpp 90%
- instance of machine learning 90%
- partners with IBM Research 90%
- partners with Together AI 90%
- uses Transformers.js 90%
- instance of SenseNova U1 90%
- developed krish567366 / gemma-4.0-kaggle-hackathon 90%
- 2026-05-19 product_launch Hugging Face released new tools and features for Gradio, enabling custom AI front-ends and introducing the Ettin Relinker. 来源
- 2026-05-18 product_launch Hugging Face launched the Open Agent Leaderboard.
- 2026-05-14 controversy Infostealer malware campaign discovered on Hugging Face, impersonating OpenAI. 来源
- 2026-05-14 research_milestone Hugging Face published a blog post detailing a new method for asynchronous batching to improve LLM inference performance. 来源
- 2026-05-11 product_launch Hugging Face launched three new open-source projects: Daggr, custom CUDA kernels, and OpenClaw. 来源
- 2026-05-10 controversy A fake OpenAI repository impersonating a privacy filter model distributed malware on Hugging Face.
25 天有情绪数据
-
MAPF solved via multi-marginal optimal transport and Schrödinger bridges
研究人员开发了一种新方法,通过将其重新表述为一种特定的多边际最优传输(MMOT)问题来解决多智能体路径查找(MAPF)问题。该方法利用马尔可夫结构将MMOT的计算复杂度降低到多项式大小的线性规划。对于大规模应用,该方法通过薛定谔桥进一步调整,薛定谔桥提供了一种迭代的、Sinkhorn类型的解决方案,在保持近乎最优结果的同时显著降低了复杂度。
-
新的 V4FinBench 数据集对人工智能在公司破产预测中的表现进行基准测试
研究人员推出了 V4FinBench,这是一个新的基准数据集,旨在评估人工智能模型在公司破产预测方面的能力。该数据集包含来自维谢格拉德集团经济体的超过一百万条公司年度记录,涵盖六个预测期内的 131 个财务和非财务特征。初步评估显示,微调后的 TabPFN 模型表现与梯度提升方法相当或更优,而 Llama-3-8B 模型在关键指标上表现落后。
-
新模型HieraCount利用大型数据集解决多粒度对象计数问题
研究人员提出了一种新的开放世界对象计数方法,通过将问题重新定义为多粒度计数来解决当前方法的脆弱性。该方法通过视觉示例和包括否定提示在内的细粒度文本,在五个不同级别上明确定义所需的计数粒度。为了支持这一点,他们开发了一个使用3D合成和基于VLM的过滤的自动数据扩展管道,创建了KubriCount,这是迄今为止最大的计数任务数据集,并训练了一个名为HieraCount的模型,该模型显著提高了准确性和泛化能力。
-
BEACON 数据集发布,用于基于游戏的行为安全
研究人员发布了 BEACON,这是一个大规模多模态数据集,专为从游戏数据中进行连续身份验证和行为指纹识别而设计。该数据集捕获了来自竞技《Valorant》会话的同步数据,包括鼠标动态、击键、网络数据包和屏幕录制。BEACON 旨在通过利用战术射击游戏的や高认知和运动需求,为安全模型提供严格的基准。
-
BabelDOC framework enhances PDF translation with layout preservation
Researchers have developed BabelDOC, a new framework designed to improve PDF translation by preserving document layout. This system uses an intermediate representation to decouple visual metadata from semantic content, …
-
Transcoda系统实现零样本光学音乐识别
研究人员开发了Transcoda,一种用于光学音乐识别(OMR)的新型系统,可以将乐谱转录为文本格式。该系统通过采用先进的合成数据生成管道和基于语法的解码方法,解决了带注释数据集稀缺的问题。Transcoda拥有紧凑的5900万参数模型,实现了最先进的性能,超越了更大的模型,并显著降低了历史音乐扫描的错误率。
-
Muown 优化器通过控制行范数漂移来改进 LLM 训练
研究人员开发了 Muown,这是一种旨在改进大型语言模型训练的新型优化方法。Muown 解决了 Muon 优化器的问题,特别是训练过程中权重矩阵中谱范数的向上漂移。通过将行幅度向量视为显式变量,Muown 提高了各种模型规模下的困惑度和学习率稳定性,性能优于 AdamW 和 Lion 等现有优化器。
-
Ollama新增Web搜索API,云模型预览;集成Devin、GPT-5.1-Codex
Ollama发布了更新,包括Web搜索API和改进的调度功能,并预览了云模型集成。此次发布还整合了对Devin和GPT-5.1-Codex等AI代码审查工具的支持,使其能在编辑器工作流中使用。此外,Ai2 EMO在Hugging Face上发布了一个新的混合专家模型,该模型在成本效益和专业任务服务方面具有相关性。
-
新的UJEM-KL攻击通过熵最大化绕过VLM安全措施
研究人员开发了一种名为“通过熵最大化实现无目标越狱”(UJEM-KL)的新方法,用于绕过视觉语言模型(VLM)的安全措施。该技术侧重于在解码过程中操纵高熵令牌来翻转拒绝结果,而不是依赖于固定的模式。UJEM-KL在不同VLM之间表现出更高的可迁移性,并且对常见的防御措施仍然有效,这表明多模态越狱之前的局限性是由于过于受限的优化目标。
-
新基准推动表格机器学习在不平衡、字符串和多模态数据方面的发展
研究人员推出了新的基准来推动表格机器学习。TILBench 解决了跨越不同数据特征的不平衡学习问题,并揭示没有一种单一方法是普遍优越的。STRABLE 解决了表格数据中包含字符串这一研究不足的领域,发现简单的字符串嵌入与先进的表格学习器配对在类别主导的表格上表现良好。MulTaBench 专注于多模态表格学习,评估表格信息之外的文本和图像数据,并强调了针对特定任务调整嵌入的好处。
-
CausalGS 从视频中学习3D场景物理,无需显式先验
研究人员开发了CausalGS,一个能够直接从多视角视频中学习3D动态场景物理因果关系的新框架。该方法无需显式的物理先验或高质量几何重建,而是推断初始速度和内在材料属性。然后,系统在可微分物理模拟器中使用这些推断的信息,在长期未来帧外推和新视角插值方面取得了最先进的性能。
-
新数据集针对耸人听闻图像检测以进行虚假信息分析
研究人员推出了 Sens-VisualNews,这是一个新基准数据集,用于检测图像中的耸人听闻内容。该数据集包含来自新闻报道的 9,500 多张图像,并针对各种耸人听闻的概念进行了标注。该资源旨在推进对识别可能绕过批判性评估并加速病毒式传播的令人震惊或情绪化的视觉内容的研究,可能有助于检测虚假信息。
-
Phoenix-VL 1.5 Medium:专为新加坡定制的 123B 多模态模型
研究人员开发了 Phoenix-VL 1.5 Medium,这是一个拥有 1230 亿参数的多模态、多语言基础模型,专门针对新加坡的背景进行了调整。该模型在一个包含 1 万亿 token 的大规模多模态语料库上进行了预训练,并扩展了长上下文理解能力,还通过新加坡特有的文化、法律和立法数据进行了进一步优化。Phoenix-VL 1.5 Medium 在本地化基准测试中展现了最先进的性能,同时在全球通用智能和 STEM 领域保持了竞争力。
-
新的分类器改进了对话系统中个人事实的提取
研究人员开发了一种新的对话系统内个人事实的标注方案和分类器,旨在改进LLM的个性化。该方案通过添加人口统计信息和财产等类别,以及持续时间和有效性属性,扩展了现有方法。使用该方案训练的分类器,结合Gemma-300M编码器,达到了81.6%的宏观F1分数,显著优于GPT-5.4-mini等少样本LLM基线。
-
Paper analyzes data augmentation's regularization effect on regression
Researchers have analyzed the regularization effects of data augmentation on supervised regression methods, particularly in scenarios where the number of covariates scales with the number of samples. The study provides …
-
腾讯发布 Hy-MT2 多语言翻译模型系列
腾讯发布了其 Hy-MT2 系列多语言翻译模型,提供 1.8B、7B 和 30B-A3B 等不同规模。这些模型支持 33 种语言之间的翻译,专为复杂的真实世界场景设计,包括指令遵循。1.8B 模型采用极致量化技术,可在设备上部署,大小缩减至 440MB,同时提升推理速度。Hy-MT2 模型表现强劲,其中 7B 和 30B-A3B 版本在性能上超越了 DeepSeek-V4-Pro 和 Kimi K2.6 等开源竞争对手,而 1.8B …
-
索尼公布 AI 战略,Ultralytics 展示视觉 AI,GPT-5.5 能力初露端倪
索尼公布了其“通过 AI 实现增长”的计划以及 2026 财年的业务战略,详细阐述了其 AI 利用的公司方向。与此同时,Ultralytics 在嵌入式视觉峰会上展示了视觉 AI 的进展和实时演示,重点关注工业应用的实际计算机视觉模型部署。此外,Sébastien Bubeck 的一条推文暗示了 AI 模型的高级功能,表明它们超越了 GPT-5.5 的能力。另外,Hugging Face 在伊斯坦布尔举办的开源 AI 见面会分享了关于…
-
New GLiNER2-PII model excels at multilingual PII extraction
Researchers have developed GLiNER2-PII, a compact 0.3 billion parameter model designed for multilingual personally identifiable information (PII) extraction. This model, adapted from GLiNER2, can identify 42 different t…
-
Hugging Face 发布 Daggr、自定义 CUDA 内核和 OpenClaw
Hugging Face 发布了三个旨在增强 AI 开发和应用集成的新开源项目。Daggr 允许以编程方式连接应用程序并进行可视化检查,第二个项目探索使用 Codex 和 Claude 创建自定义 CUDA 内核以实现更广泛的可访问性。第三个发布是 OpenClaw,被呈现为一个需要“解放”的工具,暗示其重点在于开放访问和修改。
-
RAG 系统通过集成外部数据检索来增强 LLM
检索增强生成(RAG)系统是通过允许大型语言模型(LLM)访问和利用外部、最新的信息来增强 LLM 的关键技术。RAG 通过在生成响应之前检索相关数据来解决 LLM 的知识截止日期和上下文窗口限制等局限性。这种方法与微调不同,微调会修改模型的行为而不是其知识库。构建 RAG 系统涉及两个主要管道:用于准备和存储数据的摄取管道,以及为每个用户查询获取上下文的检索管道。