PulseAugur
实时 11:43:37
English(EN) Terastal: Layer-Variant-based Scheduling for Real-Time Multi-DNN Workloads on Heterogeneous Accelerators

Terastal框架优化异构加速器上的DNN调度

研究人员开发了Terastal,一个旨在改进异构加速器上多个深度神经网络(DNN)的调度的新框架,适用于软实时应用。该系统通过创建定制的“层变体”(DNN层的优化实现)来解决加速器之间的延迟差异。Terastal结合了离线设计和在线调度,以平衡时间和准确性,据报道,与现有方法相比,其截止日期未完成率降低了30%以上,同时保持了高准确性。 AI

影响 优化专用硬件上的实时DNN执行,可能提高AI应用的性能和可靠性。

排序理由 这是一篇研究论文,详细介绍了一种用于优化硬件上DNN工作负载的新框架和方法论。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Sing-Yao Wu, Fengshuo Song, Eli Bozorgzadeh ·

    Terastal:基于层变体的异构加速器上实时多DNN工作负载的调度

    arXiv:2606.06818v1 Announce Type: cross Abstract: Heterogeneous DNN accelerators improve soft real-time multi-DNN execution by mapping each layer to its preferred accelerator to reduce latency. However, under skewed workloads, large layer-latency differences across accelerators l…