Hugging Face
Hugging Face is one of the entities PulseAugur tracks across the AI industry. This page surfaces every recent cluster mentioning Hugging Face — vendor announcements, third-party press, social commentary, research papers, and regulatory filings — ranked by signal across our 200+ source set. Linked to the canonical entity record on Wikipedia and Wikidata so the entity card AI engines build is grounded in the same identity Wikipedia uses, not a slug-collision lookalike.
- acquired Gradio 95%
- partners with NVIDIA 90%
- partners with Intel 90%
- founded Liang Wenfeng 90%
- instance of Qwen3.6-27B 90%
- partners with llama.cpp 90%
- instance of machine learning 90%
- partners with IBM Research 90%
- partners with Together AI 90%
- uses Transformers.js 90%
- instance of SenseNova U1 90%
- developed krish567366 / gemma-4.0-kaggle-hackathon 90%
- 2026-05-19 product_launch Hugging Face released new tools and features for Gradio, enabling custom AI front-ends and introducing the Ettin Relinker. 来源
- 2026-05-18 product_launch Hugging Face launched the Open Agent Leaderboard.
- 2026-05-14 controversy Infostealer malware campaign discovered on Hugging Face, impersonating OpenAI. 来源
- 2026-05-14 research_milestone Hugging Face published a blog post detailing a new method for asynchronous batching to improve LLM inference performance. 来源
- 2026-05-11 product_launch Hugging Face launched three new open-source projects: Daggr, custom CUDA kernels, and OpenClaw. 来源
- 2026-05-10 controversy A fake OpenAI repository impersonating a privacy filter model distributed malware on Hugging Face.
26 天有情绪数据
-
Self-supervised learning rules mimic brain's data hierarchy acquisition
Researchers have explored biologically plausible learning rules for artificial neural networks to understand how the brain learns hierarchical structures from high-dimensional data. They tested two types of local learni…
-
PaddleOCR 3.5 adds Transformers backend for easier AI integration
PaddleOCR 3.5 has been released, integrating the Transformers library as a new backend option for its OCR and document parsing models. This update allows developers to more seamlessly incorporate PaddleOCR's capabilitie…
-
Hugging Face launches Open Agent Leaderboard for AI systems
Hugging Face has launched the Open Agent Leaderboard, a new framework for evaluating the performance and cost of AI agent systems. This benchmark focuses on assessing an agent's generality across diverse tasks and setti…
-
新的共形预测方法改进了不确定性量化
两篇新研究论文介绍了共形预测的两种新方法,这是一种用于量化机器学习模型不确定性的方法。第一篇论文“Decoupled Conformal Optimisation”提出了一个训练-调优-校准框架,该框架使用独立的数据分割来进行结构选择和最终校准,从而在各种基准测试中获得更小的预测集和区间宽度。第二篇论文“Decomposition-Based Modular Conformal Prediction”将共形预测扩展到两阶段建模,允许将…
-
PH-Dreamer integrates physics into world models for structured latent imagination
Researchers have developed PH-Dreamer, a novel physics-driven world model that integrates principles of Port-Hamiltonian dynamics. This framework embeds physical priors into recurrent transitions, enabling more structur…
-
SANA-WM 模型生成时长一分钟的 720p 视频
研究人员发布了 SANA-WM,一个能够生成时长一分钟、分辨率为 720p 的视频的开源世界模型。该扩散 Transformer 模型采用了混合线性注意力机制和双分支架构来实现精确的相机控制。该模型还包含一个两阶段生成流程,并使用精炼器来增强质量和时间一致性,它使用具有度量尺度 6-DoF 相机姿态的强大标注流程进行训练。
-
新的基准和合成数据旨在提升AI的自我中心视频理解能力
研究人员引入了新的基准和合成数据生成方法,以提高大型多模态模型(LMMs)在自我中心视频数据上的性能。EgoBabyVLM基准侧重于从自然、弱对齐的自我中心视频中进行语言接地,突显了当前LMMs在该领域的局限性。类似地,EgoExoMem使用同步的自我中心和外中心视频来解决跨视图记忆推理问题,表明现有模型难以达到高精度。为了克服数据收集的挑战,EgoInteract提供了一个可控的模拟器,用于生成具有密集注释的合成自我中心视频,并在真…
-
New TeleCom-Bench benchmarks LLMs for telecom industry tasks
Researchers have introduced TeleCom-Bench, a new benchmark designed to evaluate the capabilities of large language models (LLMs) in the telecommunications industry. The benchmark includes over 22,000 samples across know…
-
攻击者利用AI平台信任分发恶意软件
安全研究人员正在强调一种新趋势,即攻击者利用知名平台的信誉来分发恶意软件。这包括使用Anthropic的Claude.ai等平台上的共享聊天来传播恶意软件,以及在Hugging Face上创建冒充合法AI工具的虚假存储库。攻击者利用用户对这些平台的信任,使得平台本身成为主要的攻击面,而不是恶意软件的复杂性。
-
TinySAM 2 提供高效视频分割,具有极度内存压缩
研究人员开发了 TinySAM 2,这是 Segment Anything Model 2 (SAM 2) 的一个更高效版本,用于视频分割和对象跟踪。TinySAM 2 采用内存质量管理机制和联合时空令牌压缩,显著降低了内存存储和计算成本。通过这些优化,该模型仅使用 7% 的内存令牌和 3% 的训练数据即可达到 SAM 2.1 性能的 90%,使其更适合在资源受限的设备上部署。
-
UniTrans模型实现异构感知数据的零样本翻译
研究人员开发了UniTrans,一个新颖的通用模型,专为协作感知系统中的任意到任意特征模态翻译而设计。该模型通过预训练一组翻译专家并动态组合它们以实现新的模态映射,解决了异构传感器数据带来的挑战。UniTrans通过从中间特征中提取场景不变码来实现零样本翻译,在基准数据集上的表现优于现有方法,并为实际应用提供了可扩展的解决方案。
-
New LAST-RAG method improves equipment degradation modeling with knowledge integration
Researchers have developed a new method called LAST-RAG to improve the selection of stochastic processes for modeling equipment degradation and predicting remaining useful life. This approach integrates observed data wi…
-
New MeanFlow technique stabilizes large diffusion model distillation
Researchers have developed a new framework to stabilize and enhance MeanFlow, a technique used for distilling large-scale diffusion models. The method introduces a warm-up phase with a discrete solution before switching…
-
Qwen 3.5 和 3.6 模型的 Jinja 聊天模板已更新
Qwen 3.5 和 3.6 模型的 Jinja 聊天模板已更正。这些模板用于与 AI 模型交互,托管在 Hugging Face 上。更新通过社交媒体和专门的信息网站分享。
-
新的 SBPN 模型通过知识蒸馏提升尼日利亚语言 ASR 性能
研究人员开发了一个名为 Sometin Beta Pass Notin (SBPN) 的新多语言自动语音识别 (ASR) 框架,以提高尼日利亚语言的性能。该框架采用两阶段知识蒸馏过程,首先从单一语言模型进行蒸馏,然后通过伪标记数据的迭代自我改进。该方法在 Common Voice 和 Fleurs 等基准测试中,相对于基线平均降低了 29% 的词错误率,并且优于现有的最先进的多语言模型。SBPN 以两种尺寸发布为开放基础模型,旨在为该…
-
新基准评估全模态大语言模型在长视频理解方面的能力
研究人员推出了 OmniPro 和 VideoOdyssey 两个新基准,旨在评估全模态大语言模型理解长而复杂视频内容的能力。OmniPro 专注于主动式流媒体视频理解,评估模型从视听流中决定何时以及说什么的能力,包含跨越不同任务的 2,700 个经人工验证的样本。VideoOdyssey 针对超长上下文视频理解,包含极长的视频(平均 109 分钟),并评估在长时间内的连续推理和记忆保持能力。这两个基准都突显了当前模型在长视域鲁棒性、…
-
推荐Q4_K_M用于本地LLM量化,平衡质量和显存
文章推荐Q4_K_M量化作为大多数本地LLM用户在质量和显存效率之间取得最佳平衡的选择,可保留93-96%的FP16质量。对于拥有更多显存的用户,Q5_K_M在复杂推理和创意任务方面提供了显著的改进。Q3_K_M等较低的量化级别被视为在显存受限情况下的折衷方案,而Q6_K和Q8_0的收益递减,Q2_K及以下由于质量严重下降而被视为最后的选择。
-
AI agent controls robot arm, trains new models
An AI agent named OpenClaw was successfully integrated with a physical robot arm, enabling it to configure the arm, grasp objects, and even train another AI model for specific tasks. This development, utilizing an open-…
-
开源工具帮助用户为硬件选择自托管 LLM
一个开源工具已被开发出来,以帮助用户选择与特定硬件兼容的自托管大型语言模型(LLM)。该工具在浏览器中运行,考虑平台、可用内存和预期用例等因素来推荐合适的模型。它还提供了一个精选的模型目录,包含清晰的许可信息、安装指南和面向新手的术语表。
-
H公司发布具有UI本地化功能的Holo2 LLM
H公司已发布其新的Holo2模型,这是一个拥有2350亿参数的大型语言模型。该模型在UI本地化方面取得了显著进展,预示着其多语言能力有所提升。此次发布通过Hugging Face上的博客文章宣布。