实体
Deportation Data Project
Deportation Data Project
PulseAugur coverage of Deportation Data Project — every cluster mentioning Deportation Data Project across labs, papers, and developer communities, ranked by signal.
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 3 条
-
缓慢的 PyTorch DDP Rank 会破坏训练速度
本文讨论了 PyTorch 分布式数据并行 (DDP) 作业中一个常见的性能瓶颈。文章解释说,即使单个缓慢的 DDP Rank 没有导致崩溃或内存不足错误,它也会显著增加整体训练时间。这个问题很隐蔽,因为所有 GPU 都显示为活动状态,但训练循环的进度取决于最慢组件的速度。
-
新的优化器有望实现更快、更节省内存的 AI 模型训练
两篇新的研究论文介绍了用于深度学习模型的新型优化技术。第一篇论文《Fantastic Pretraining Optimizers and Where to Find Them II: Hyperball Optimization》提出了 Hyperball,这是一种优化器包装器,通过固定权重矩阵范数来在模型规模不断增大的情况下保持性能提升。第二篇论文《OptEMA: Adaptive Exponential Moving Avera…
-
ChatGPT捏造了关于20世纪80年代澳大利亚电视软件的细节
一位用户发现ChatGPT虚构了关于Equinox软件套件的详细描述,该软件套件用于管理20世纪80年代澳大利亚地区电视的商业排程。当被要求提供来源时,ChatGPT错误地引用了一篇不包含虚假信息的文章。此事件凸显了AI模型生成看似合理但实际上不准确内容的潜在风险。