Hugging Face 的 Transformers 库发布了 5.11.0 版本,引入了 DiffusionGemma 和 DeepSeek-V3.2 等新模型。DiffusionGemma 采用带有多画布采样(multi-canvas sampling)的编码器-解码器架构,可实现更快的推理速度;DeepSeek-V3.2 则集成了新颖的稀疏注意力机制(sparse attention mechanism),以提高长上下文效率。此次更新还包括对内核集成(kernel integration)、并行化(parallelization)的改进以及库中的各种错误修复。 AI
影响 集成了新模型和效率技术,可能提高 Transformers 库用户的性能。
排序理由 这是一个软件库版本发布,集成了新模型和技术改进,而非来自主要实验室的前沿模型发布。[lever_c_demoted from research: ic=1 ai=1.0]
在 Transformers — Releases 阅读 →
- DeepSeek Sparse Attention
- DeepSeek-V3.2
- DiffusionGemma
- FalconMamba
- Hugging Face
- NemotronH
- Qwen2.5-VL
- Qwen2-VL
- Qwen3-VL
- Transformers
- v5.11.0
- Zamba2
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →