研究人员开发了一个名为 CROWD IO 的新系统,以实现资源受限的 Android 设备上大型深度神经网络的高效推理。该系统通过将内存压力分布到多个设备上来解决手机 RAM 有限的挑战。CROWD IO 采用多种机制,包括延迟分区加载和压缩张量传输,来管理内存使用并减少批处理延迟。 AI
影响 支持将先进的 AI 模型部署到更广泛的移动设备上,可能增强边缘 AI 功能。
排序理由 学术论文,详细介绍了在资源受限设备上进行高效 DNN 推理的新颖系统。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →