实体 Kimi K2

Kimi K2

PulseAugur coverage of Kimi K2 — every cluster mentioning Kimi K2 across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 19

发布 · 30天

90 天内 0

论文 · 30天

90 天内 6

层级分布 · 90 天

significant 4
research 3
tool 10
commentary 2

主题

基础设施 11
模型发布 11
产品 11
论文 6
安全 1
其他 1

关系

competes with General Language Model 70%
competes with GLM-5.2 70%

时间线

2026-06-17 product_launch Moonshot AI launched Kimi K2, a new 128B open-source model for coding and agentic reasoning. 来源

情绪 · 30 天

6 天有情绪数据

最近 · 第 1/1 页 · 共 19 条

TOOL · CL_128830 · Jul 7 · 04:00

研究发现：大型语言模型在填充标记上执行隐藏计算

研究人员发现，像DeepSeek V3和Kimi K2这样先进的大型语言模型会利用看似不含内容的填充标记（如点或计数序列）执行复杂的计算。这种绕过标准行为监督方法（如思维链）的隐藏计算，可以从模型的内部状态中高精度地解码出来。研究结果表明，大型语言模型的监控能力取决于对其完整计算轨迹的分析，而不仅仅是其表面输出。
TOOL · CL_128749 · Jul 7 · 04:00

新研究揭示LLM中的安全对齐失败对网络安全的影响

研究人员对包括1万亿参数的Kimi K2在内的24个开源大型语言模型（LLM）进行了大规模实验，以研究安全对齐失败如何影响网络安全。他们发现，尤其是在参数量达万亿的混合专家（MoE）架构中，由于拒绝机制分布在许多层中，因此可以实现特定领域的安全电路的消除。该研究确定，安全训练的类型和模型架构是模型易受这种特定领域消除影响的关键预测因素，从而将模型分为三个层级。
TOOL · CL_118842 · Jun 30 · 20:14

智谱AI的GLM模型在本地代理性能方面接受测试

智谱AI的GLM模型系列因其强大的基准测试数据和开放权重而受到AI开发社区的关注，尤其是在编码任务方面。作者正在消费级家庭实验室环境中测试GLM-5.2和GLM-4.7-Flash，以评估它们作为本地代理模型的可行性。虽然GLM-5.2是一个大型模型，不太可能在测试硬件上表现良好，但GLM-4.7-Flash，一个30B参数的MoE模型，被定位为一个轻量级竞争者，可与Qwen等现有模型相媲美。
COMMENTARY · CL_113395 · Jun 27 · 10:01

中国AI模型为欧洲开发者提供经济高效的替代方案 · 跟踪2个来源

中国AI模型，如DeepSeek、GLM、Kimi、Qwen和ERNIE，正成为欧洲开发者的经济高效替代方案，其性能可与GPT-4o、Claude和Gemini等西方模型相媲美，但价格却显著更低。由于基础设施成本降低、硬件优化、激进的定价策略以及开源权重的可用性等因素，这些模型每百万token的价格便宜10到30倍。AIWave等平台通过提供与OpenAI格式兼容的统一API，简化了欧洲开发者的集成，使得无需进行大量代码重写即可轻松采用。
SIGNIFICANT · CL_103026 · Jun 21 · 23:17

AI板块蓄势待发：算力、PCIe及药物发现引领增长

36氪的多篇报道突显了对AI行业的看好，特别关注了对算力的需求。中信证券和中信建投的分析师预测，随着GLM-5.2和Kimi K2等国内AI模型能力的提升，AI算力将持续增长。报道还强调了PCIe协议和交换机在扩展GPU连接性方面的关键作用，预计PCIe交换机市场将显著增长。此外，AI的进步正在彻底改变药物发现，预计到2035年AI制药市场将达到460亿美元。
RESEARCH · CL_98101 · Jun 17 · 11:29

新的SenFlow方法改进了混合文档中AI生成文本的检测 · 跟踪到2个来源

研究人员开发了SenFlow，一种用于检测人与AI合著文档中AI生成文本的新颖方法。与以往孤立分析句子的方法不同，SenFlow将检测视为一个结构化预测问题，对句间依赖关系进行建模。该方法在MOSAIC上进行了评估，MOSAIC是一个包含DeepSeek V3.2和Kimi K2生成的16,000份混合文档的新基准，并取得了最先进的性能。
SIGNIFICANT · CL_96610 · Jun 17 · 11:19

Moonshot AI 发布 Kimi K2，一款 128B 开源编码模型

Moonshot AI 发布了 Kimi K2，这是一款新的 1280 亿参数开源模型，专为复杂的编码任务和智能体推理而设计。这款混合专家模型在 14.7 万亿个 token 上进行训练，在推理基准测试中可与 Claude 3.5 Sonnet 和 GPT-4o 等顶级闭源模型相媲美。Kimi K2 在 Apache 2.0 许可下可用，在数学和编码评估中表现强劲，并支持工具使用和长上下文窗口。
TOOL · CL_95560 · Jun 17 · 01:14

推荐RTX 4090用于本地Kimi K2推理

对于希望在本地运行Kimi K2模型的用户来说，拥有24GB显存的RTX 4090被认为是最佳的消费级GPU。该显卡可以处理Kimi K2的活跃专家和大量的KV缓存，在Agentic任务中提供每秒25-35个token的速度。虽然RTX 3090等旧款显卡在显存方面具有不错的性价比，但对于需要更大KV缓存容量的更复杂的Agentic编排场景，推荐使用RTX 5090等高端选项。
COMMENTARY · CL_91922 · Jun 15 · 13:05

OpenRouter 因 5.5% 的费用面临批评，促使替代方案出现

两篇文章讨论了 OpenRouter 的替代方案。OpenRouter 是一个托管式 LLM 网关，对信用卡充值收取 5.5% 的费用。一位作者提倡自托管 LiteLLM，一个开源 LLM 网关，并建议 InstaPods 等托管 Pod 作为低运维解决方案，以满足优先考虑数据控制和直接供应商支付的用户需求。另一位作者批评 OpenRouter 的费用对于生产工作负载来说成本过高，并推出 haotokai，一个更简单的替代方案，专注于…
TOOL · CL_76047 · Jun 7 · 11:47

AI 库在各提供商之间标准化“模型思考”

一个名为 aichain 的新库已被开发出来，用于标准化跨不同提供商实现通用 LLM 功能。这项功能允许模型在响应前“思考更长时间”，由 OpenAI、Anthropic 和 Google 等主要人工智能公司提供，但具有不同的 API 参数和行为。aichain 库抽象了这些差异，提供了一个单一的“推理”参数，该参数会转换为每个提供商的特定实现，从而简化了利用多个 LLM 服务的应用程序的开发。
TOOL · CL_64390 · Jun 1 · 19:50

开发者构建三层 LLM 路由器以绕过速率限制

一位开发者构建了一个三层故障转移路由器来管理 LLM API 调用的速率限制，防止用户流失。该系统优先使用主模型，并在首选选项达到速率限制时自动切换到备用或最后手段模型。这种架构通过降低性能而非导致完全中断来确保服务连续性，并包含一个冷却机制，以避免重复查询已耗尽的模型。
RESEARCH · CL_44360 · May 22 · 15:59

Together AI 推出自适应 LLM 推理系统 ATLAS

Together AI 推出了 ATLAS，一个新颖的自适应学习系统，用于推测性解码，可在无需手动调整的情况下动态提高 LLM 推理性能。与标准或自定义推测器不同，ATLAS 可持续从运行时使用和不断变化的工作负载中学习，以实时优化 token 草稿。该系统实现了显著的加速，在 DeepSeek-V3.1 上达到高达 500 TPS，在 Kimi-K2 上达到 460 TPS，甚至超越了 Groq 等专用硬件。
RESEARCH · CL_26810 · May 11 · 12:43

Kimi-K2 模型使用 DeepSeek-V3 组件构建

一份技术教程详细介绍了使用 DeepSeek-V3 模型组件构建和训练 Kimi-K2 模型的过程。该指南重点介绍了 Kimi-K2 和 DeepSeek-V3 之间的关键架构差异，并提供了对其开发过程的见解。
TOOL · CL_25188 · May 10 · 15:25

Qwen 3.5 在切换到 llama.cpp 后引领本地 LLM 基准测试

一篇技术博文详细介绍了从使用 Ollama 转为使用 llama.cpp 在本地运行大型语言模型的转变过程。作者发现，Ollama 虽然用户友好，但引入了一个可能导致基准测试结果偏差的抽象层。通过迁移到 llama.cpp，作者获得了对推理参数更精细的控制，从而能够进行更准确的基准测试和优化。这一改变使得 Qwen 3.5 在编码和智能体任务中成为表现最佳的模型。
RESEARCH · CL_21552 · May 7 · 23:28

Gemma 4 和 Kimi K2 模型在本地推理方面进行测试

模型对决的第二回合包括来自 Google 的 Gemma 4 和来自 Moonshot AI 的 Kimi K2，重点关注本地推理能力。Gemma 4 是一个 27B 参数模型，已轻松集成到 Coder 平台。相比之下，Kimi K2 是一个拥有 256K 上下文窗口的 1 万亿参数模型，由于其巨大的 579 GB 体积，在本地推理方面带来了严峻挑战，需要使用 llama.cpp 进行内存映射 NVMe 卸载。
SIGNIFICANT · CL_07575 · Apr 28 · 13:00

Tenstorrent 发布 Galaxy Blackhole AI 服务器，配备 32 个加速器

Tenstorrent 已宣布其 Galaxy Blackhole AI 计算平台全面上市，该平台在一个 6U 机箱中配备 32 个 Blackhole 加速器，售价为 110,000 美元。该系统提供 23 petaFLOPS 的 FP8 性能，并可扩展为更大的集群。该公司声称其软件堆栈有了显著改进，能够快速处理大型提示和高令牌生成率，并计划支持更多前沿模型。
RESEARCH · CL_02985 · Apr 23 · 03:48

新指标量化大型语言模型代理的行为相似性和收敛性

一篇新论文介绍了两个指标：响应模式相似性（RPS）和动作图相似性（AGS），用于量化不同AI代理的工具使用行为有多相似。这些指标旨在区分与任务相关的基本操作和模型蒸馏产生的非必要行为模式。研究发现，同一提供商的模型比不同提供商的模型表现出更相似的工具使用习惯，并强调了Kimi-K2的高相似性得分。
FRONTIER RELEASE · CL_01790 · Nov 6 · 05:44

Kimi K2 模型拥有 1T 参数和 SOTA HLE，同时 Soumith Chintala 离开 PyTorch

Kimi 推出的新模型 Kimi K2 拥有 1 万亿参数，并在 HLE 基准测试中取得了最先进（SOTA）的成果。它还在 BrowseComp 和 TauBench 中展示了能力。另外，Soumith Chintala 已从 PyTorch 离职。
SIGNIFICANT · CL_47665 · Aug 27 · 00:00

Together AI 提升推理速度并部署定制模型

Together AI 推出了 Dedicated Container Inference，这是一项旨在优化自定义生成媒体模型的部署和执行的新服务。该平台提供生产级编排，包括自动扩展和监控，使团队能够直接将其 Docker 容器部署到 Together 的 GPU 基础设施上。该公司还宣布了其推理平台的显著性能改进，声称通过硬件优化、高级量化和推测解码，开源 LLM 的速度提高了 2 倍。此外，Together AI 现在提供对 De…

研究发现：大型语言模型在填充标记上执行隐藏计算

新研究揭示LLM中的安全对齐失败对网络安全的影响

智谱AI的GLM模型在本地代理性能方面接受测试

中国AI模型为欧洲开发者提供经济高效的替代方案 · 跟踪2个来源

AI板块蓄势待发：算力、PCIe及药物发现引领增长

新的SenFlow方法改进了混合文档中AI生成文本的检测 · 跟踪到2个来源

Moonshot AI 发布 Kimi K2，一款 128B 开源编码模型

推荐RTX 4090用于本地Kimi K2推理

OpenRouter 因 5.5% 的费用面临批评，促使替代方案出现

AI 库在各提供商之间标准化“模型思考”

开发者构建三层 LLM 路由器以绕过速率限制

Together AI 推出自适应 LLM 推理系统 ATLAS

Kimi-K2 模型使用 DeepSeek-V3 组件构建

Qwen 3.5 在切换到 llama.cpp 后引领本地 LLM 基准测试

Gemma 4 和 Kimi K2 模型在本地推理方面进行测试

Tenstorrent 发布 Galaxy Blackhole AI 服务器，配备 32 个加速器

新指标量化大型语言模型代理的行为相似性和收敛性

Kimi K2 模型拥有 1T 参数和 SOTA HLE，同时 Soumith Chintala 离开 PyTorch

Together AI 提升推理速度并部署定制模型