实体
NVIDIA A100 GPU
NVIDIA A100 GPU
PulseAugur coverage of NVIDIA A100 GPU — every cluster mentioning NVIDIA A100 GPU across labs, papers, and developer communities, ranked by signal.
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
3
90 天内 3
层级分布 · 90 天
情绪 · 30 天
3 天有情绪数据
最近 · 第 1/1 页 · 共 3 条
-
PhaseNet 工作流提高地震波探测精度
研究人员开发了一种使用 PhaseNet 机器学习模型的新工作流,以提高远震数据的地震波探测能力。该工作流在 MsPASS 中实现,与在区域数据上训练的模型相比,P波拾取的召回率显著提高了 700% 以上。虽然增加模型大小提高了准确性,但推理速度却急剧下降,这表明与 CPU 相比,GPU 更适合扩展此应用程序。
-
ModeSwitch-LLM 提升单GPU LLM推理效率
研究人员开发了ModeSwitch-LLM,这是一种轻量级的控制器,旨在提高单个GPU上大型语言模型推理的效率。该系统根据工作负载特征,动态地将请求路由到各种推理模式,包括量化、推测和混合配置。在Meta-Llama-3.1-8B-Instruct上的评估表明,与标准的FP16相比,延迟速度提高了2.10倍,每token的能耗降低了51.7%,同时保持了近乎等效的准确性。
-
新方法提升视频扩散模型的效率和质量
研究人员开发了几种新技术来改进视频扩散模型,重点关注效率和质量。一种方法 LocalDPO 在局部时空区域级别优化对齐,以获得更好的视频保真度和连贯性。另一种方法 ARL2 将二次自注意力替换为固定大小的循环状态,以实现线性时间缩放和恒定的内存使用,从而加快生成速度并减少内存需求。此外,ORBIS 是一种软硬件协同设计的加速器,它使用输出激活来实现更准确的令牌间相似性,从而获得更高的令牌缩减率,并显著提高速度和降低能耗。最后,Bern…