PulseAugur
实时 18:34:17
English(EN) Efficiency-Performance Trade-offs in Neural Speaker Diarization via Structured Pruning and Low-Bit Quantization

神经说话人分割模型为提高效率而压缩

研究人员探索了神经说话人分割在资源受限硬件上的效率-性能权衡,特别适用于医疗调度等时间关键型应用。他们使用 SIMSAMU 数据集评估了剪枝和低比特量化等模型压缩技术。研究发现,虽然模型压缩会减小内存占用,但会降低性能,在特定操作点,尽管模型大小减半并保持实时因子,但使用 FP16 时 DER 相对增加了 40%。 AI

影响 描述了语音技术在关键场景下实时部署的权衡。

排序理由 该集群包含一篇学术论文,详细介绍了神经说话人分割模型压缩技术的研究。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

神经说话人分割模型为提高效率而压缩

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Rishit Chatterjee, Tahiya Chowdhury ·

    通过结构化剪枝和低比特量化实现神经说话人日志记录的效率-性能权衡

    arXiv:2606.14030v1 Announce Type: cross Abstract: Streaming speaker diarization is crucial for time-critical medical dispatch, but deploying it on resource-constrained hardware requires smaller, faster models. Using SIMSAMU, a dataset of simulated medical-dispatch conversations, …

  2. arXiv cs.CL TIER_1 English(EN) · Tahiya Chowdhury ·

    通过结构化剪枝和低比特量化实现神经说话人日志记录的效率-性能权衡

    Streaming speaker diarization is crucial for time-critical medical dispatch, but deploying it on resource-constrained hardware requires smaller, faster models. Using SIMSAMU, a dataset of simulated medical-dispatch conversations, we evaluate streaming behavior before compressing …