PulseAugur
实时 22:14:52

机器人模仿学习管道训练速度极慢

一位用户在 r/MachineLearning 论坛上就机器人模仿学习中训练管道速度极慢的问题寻求建议。尽管使用了约 5000 万参数的 Diffusion Transformer (DiT) 模型和包括 NVIDIA A4500 GPU 在内的现代硬件,训练吞吐量仅为每秒约 10 次迭代,导致训练时间长达数天。用户观察到 CPU 利用率高而 GPU 利用率低,并且尝试通过冻结编码器或使用合成数据进行优化,效果甚微。 AI

排序理由 用户正在寻求关于训练管道速度慢的帮助,而不是宣布新模型或研究。

在 r/MachineLearning 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/MachineLearning TIER_1 English(EN) · /u/Potential_Hippo1724 ·

    pipeline is really slow - consulting [D]

    <!-- SC_OFF --><div class="md"><p>Hi, after a long debugging process and many discussions, I wanted to ask for advice from people who may have encountered similar training bottlenecks.</p> <p>My goal is imitation learning for robotics.</p> <p>Model / Pipeline</p> <ul> <li>Observa…