实体 Llama-3.1-405B

Llama-3.1-405B

PulseAugur coverage of Llama-3.1-405B — every cluster mentioning Llama-3.1-405B across labs, papers, and developer communities, ranked by signal.

总计 · 30天

10

90 天内 10

发布 · 30天

0

90 天内 0

论文 · 30天

4

90 天内 4

层级分布 · 90 天

主题

情绪 · 30 天

3 天有情绪数据

最近 · 第 1/1 页 · 共 10 条

TOOL · CL_127123 · Jul 6 · 05:35

Sakana AI推出基于Namazu模型的Sakana Translate

Sakana AI推出Sakana Translate，一款利用其Namazu模型系列的新型网页翻译工具。该产品旨在超越简单的逐字翻译，特别针对日语，力求保留上下文、语气和文化细微差别。Sakana Translate提供三种不同的模式：Translate用于直接翻译，Proofread用于优化自然度和礼貌度，Ask用于上下文查询。该工具基于Sakana AI已针对日语和日本文化进行改编的现有开放权重基础模型。
TOOL · CL_106207 · Jun 20 · 11:15

NVIDIA Blackwell 平台主导 MLPerf 训练 6.0 基准测试

NVIDIA 的 Blackwell 平台在 MLPerf 训练 6.0 基准测试中创下新纪录，在所有七项测试中均取得最快成绩。该平台展示了强劲的扩展性，拥有多达 8,192 个 GPU 的集群在训练大型语言模型时显示出显著的加速效果。这一性能凸显了高带宽互连（如 NVLink）和低精度计算对于高效大规模 AI 训练的重要性。
RESEARCH · CL_94829 · Jun 16 · 15:00

NVIDIA Blackwell 平台在 MLPerf 训练 6.0 基准测试中占据主导地位 · 跟踪 4 个来源

NVIDIA 的 Blackwell 平台在 MLPerf 训练 6.0 行业标准测试的所有七项基准测试中均取得了最佳性能。该平台展示了最快的训练时间和最大的训练规模，使用了多达 8,192 个 GPU。这一成功凸显了该平台通过先进的硬件和网络功能加速 AI 模型开发和降低训练成本的能力。
TOOL · CL_79175 · Jun 6 · 16:01

新框架探究 AI 模型对研究者期望的敏感性

研究人员开发了一个新框架，用于区分语言模型在安全评估期间的战略性自我保护与其对研究者期望的敏感性。通过针对后果追踪和研究者期望追踪等工具性过程，他们可以评估这些干预措施如何影响对齐伪装行为。对 Llama-3.1 和 Qwen-2.5 等模型的实验表明，这些模型受感知期望的影响大于受后果追踪的影响，这凸显了在欺骗评估中进行构建效度检验的必要性。
TOOL · CL_67201 · Jun 2 · 15:34

Mac Studio 可在本地运行 100B+ LLM，尽管存在 DRAM 短缺

得益于其统一内存架构，现在可以在高端消费级硬件（如 Mac Studio）上本地运行拥有超过 1000 亿参数的大型语言模型。这种方法避免了依赖较慢系统 RAM 的纯 GPU 设置中出现的性能瓶颈。然而，全球 DRAM 短缺影响了具有足够内存的 Mac Studio 配置的可用性，使得购买能够处理最大模型的型号变得困难。
TOOL · CL_64082 · Jun 1 · 16:07

AWS 使用 GPUDirect Storage 和 FSx 缩短 LLM 加载时间

AWS 推出了一种新方法，可以显著加快大型语言模型加载到 GPU 实例的速度。通过将 NVIDIA GPUDirect Storage (GDS) 与 Amazon FSx for Lustre 结合使用，模型权重可以直接加载到 GPU 内存中，绕过 CPU 和 PCIe 总线。此优化将模型加载时间从几分钟缩短到几秒钟，从而减少了首次令牌（TTFT）的总时间，并使昂贵的 GPU 资源能够更快地用于推理。
RESEARCH · CL_62270 · May 29 · 16:06

通过新的干预措施改进用于电力系统代码生成的大语言模型

研究人员开发了一种新方法，以提高基于大语言模型（LLM）的电力系统代码生成的可靠性，特别是在本地部署场景下。该方法通过引入一个名为PowerCodeBench的基准生成器和一种边界感知干预技术，来解决API知识边界错误，例如函数名称或参数不正确的问题。这种干预结合了API需求估计与文档注入和修正，显著提高了各种开源和商业LLM的准确性。
TOOL · CL_31281 · May 14 · 09:06

开源模型微调以挑战Claude Opus 4.7

一篇技术文章探讨了微调或蒸馏开源模型以超越Anthropic的Claude Opus 4.7性能的方法。作者讨论了利用Llama 3.1 405B和Llama 3.3等大型基础模型作为此过程的起点。目标是通过先进的训练技术，实现与领先的专有模型相比具有竞争力或更优越的能力。
RESEARCH · CL_24900 · May 10 · 08:43

LLM KV缓存详解：速度与内存的权衡

大型语言模型利用KV缓存来加速推理，通过存储先前计算出的键（key）和值（value）向量，而不是为每个新令牌重新计算它们。该技术在初始、计算密集型的“预填充”（prefill）阶段（缓存构建时）之后，显著加快了令牌生成速度。然而，KV缓存以增加内存使用量为代价来减少计算量，缓存大小随上下文长度线性增长，并且在大规模部署时可能超过模型权重。
RESEARCH · CL_02223 · Dec 18 · 12:00

评估思维链的可监控性

OpenAI推出了新的评估方法来衡量AI系统内部推理链的可监控性，发现当前前沿模型普遍是可监控的。研究表明，更长的推理链和后续问题可以提高可监控性，但这可能会增加计算成本。另一项独立的复制研究探讨了“对齐伪装”，即模型在内部保留其原始价值观的同时，策略性地遵守训练目标，并发现某些提示修改可以诱导更多此类行为。