实体 Qwen2.5-72B

Qwen2.5-72B

PulseAugur coverage of Qwen2.5-72B — every cluster mentioning Qwen2.5-72B across labs, papers, and developer communities, ranked by signal.

总计 · 30天

4

90 天内 7

发布 · 30天

0

90 天内 0

论文 · 30天

3

90 天内 5

层级分布 · 90 天

主题

情绪 · 30 天

4 天有情绪数据

最近 · 第 1/1 页 · 共 7 条

TOOL · CL_141836 · Jul 12 · 02:01

新框架统一了多模态实体对齐的上下文工程和微调

研究人员开发了PTFEA，一个弥合了多模态实体对齐（MMEA）的上下文工程和模型微调之间差距的新型框架。该框架从理论上证明了上下文工程中的提示组件可以模拟顺序微调。PTFEA采用课程学习方法，通过自适应难度调整和渐进式推理来镜像梯度下降过程，与现有方法相比，在性能上有所提高，并显著降低了运行时间和令牌消耗。
RESEARCH · CL_128507 · Jul 4 · 00:00

新的基准和方法解决了 LLM 代理工具使用失败的问题

研究人员正在开发新的方法来识别和缓解使用外部工具的大型语言模型 (LLM) 代理中的失败。一种方法，“少推理，多验证”，引入了确定性的预执行门来防止静默策略违规，提高了 gpt-4o-mini 等模型的成功率，甚至对 gpt-5.2 等前沿模型也显示出希望。另一个框架 AgentLocate 专注于查明导致系统范围失败的具体代理和最早的步骤。此外，ToolFailBench 提供了一个诊断性基准来对工具使用失败进行分类，揭示了 Lla…
RESEARCH · CL_108834 · Jun 22 · 04:27

新的推测解码方法提高了 LLM 推理速度和安全性

研究人员正在开发先进的推测解码技术，以加速大型语言模型推理。HyperDFlash 针对 DeepSeek-V4 的多超连接架构优化了解码，提高了草稿的准确性和速度。Dustin 通过识别关键标记并减少重新计算来专注于高效的长上下文生成。同时，TAIS 对推测解码的输出进行安全性不变性筛选，发现在温度为零时没有分歧。JetSpec 和 RLM-Cascade 通过结合草稿策略并在响应级别应用推测解码来实现高性价比的 API 服务，提供…
RESEARCH · CL_93583 · Jun 15 · 10:30

新的DoubtProbe防御显著减少了LLM越狱

研究人员开发了DoubtProbe，这是一种新颖的防御机制，旨在应对黑盒场景下大型语言模型（LLM）的越狱尝试。该双分支框架结合了结构验证和语义审计，以识别逃避安全对齐的越狱提示中的不一致之处。在Qwen2.5-72B和Llama 3.1 70B等模型上进行测试时，DoubtProbe显著降低了攻击成功率，同时在良性请求上保持了较低的误报率。
RESEARCH · CL_06733 · Apr 28 · 04:00

AgentHER框架通过失败轨迹重标记提升LLM代理训练

研究人员开发了AgentHER，一个旨在通过重新利用失败轨迹来改进LLM代理训练的新框架。该系统将后视经验回放（Hindsight Experience Replay）应用于自然语言，识别失败尝试中其他可实现的目标。此方法将丢弃的数据转化为有价值的训练材料，显著提高了各种模型规模下代理的性能和数据效率。
RESEARCH · CL_05137 · Apr 27 · 04:00

HACHIMI 使用编排式代理为教育 LLM 生成 100 万个学生角色

研究人员开发了 HACHIMI，一个新颖的多代理框架，旨在为教育大型语言模型生成可扩展且可控的学生角色。该系统通过将角色生成与教育理论相结合并实现对人口分布的控制，解决了先前方法的局限性。该框架生成了一个包含 100 万个角色的语料库 HACHIMI-1M，该语料库已针对模式有效性、配额准确性和多样性进行了评估，在数学和好奇心构建方面表现出高度一致性，但在课堂氛围和幸福感方面则表现出中度一致性。
TOOL · CL_47672 · Jan 12 · 00:00

多节点训练赋能跨 GPU 集群扩展基础模型

训练大型基础模型需要将工作负载分布到多台互联机器上的众多 GPU 上，这一过程称为多节点训练。这种方法对于处理参数量达数十亿甚至数万亿、超出单台服务器内存容量且否则需要数月才能完成训练的模型至关重要。有效得多节点训练依赖于复杂的并行策略、高速网络互连和强大的容错机制，以确保计算的高效性和进展。