PulseAugur
实时 01:05:44
实体 Qwen2.5-72B

Qwen2.5-72B

PulseAugur coverage of Qwen2.5-72B — every cluster mentioning Qwen2.5-72B across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
最近 · 第 1/1 页 · 共 3 条
  1. RESEARCH · CL_06733 ·

    AgentHER框架通过失败轨迹重标记提升LLM代理训练

    研究人员开发了AgentHER,一个旨在通过重新利用失败轨迹来改进LLM代理训练的新框架。该系统将后视经验回放(Hindsight Experience Replay)应用于自然语言,识别失败尝试中其他可实现的目标。此方法将丢弃的数据转化为有价值的训练材料,显著提高了各种模型规模下代理的性能和数据效率。

  2. RESEARCH · CL_05137 ·

    HACHIMI generates 1M student personas for educational LLMs using orchestrated agents

    Researchers have developed HACHIMI, a novel multi-agent framework designed to generate scalable and controllable student personas for educational large language models. This system addresses limitations in prior methods…

  3. TOOL · CL_47672 ·

    多节点训练赋能跨 GPU 集群扩展基础模型

    训练大型基础模型需要将工作负载分布到多台互联机器上的众多 GPU 上,这一过程称为多节点训练。这种方法对于处理参数量达数十亿甚至数万亿、超出单台服务器内存容量且否则需要数月才能完成训练的模型至关重要。有效得多节点训练依赖于复杂的并行策略、高速网络互连和强大的容错机制,以确保计算的高效性和进展。