一篇新研究论文挑战了长期以来认为双精度 (FP64) 硬件对高性能计算 (HPC) 至关重要的观点。作者提出,使用 FP8 张量核心,结合 Ozaki Scheme II 等特定重建方案,可以达到完整的 FP64 精度。这种方法有望在下一代 GPU 上显著提升性能,可能使许多科学计算任务的本地 FP64 芯片过时。 AI
影响 这项研究可能通过利用 AI 优化的硬件来执行传统 HPC 任务,从而在科学计算中实现显著的性能提升。
排序理由 该集群包含一篇研究论文,详细介绍了一种使用 FP8 硬件实现 FP64 精度的新方法。[lever_c_demoted from research: ic=1 ai=0.7]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →