MNIST database
PulseAugur coverage of MNIST database — every cluster mentioning MNIST database across labs, papers, and developer communities, ranked by signal.
6 天有情绪数据
-
VoodooNet bypasses training with high-dimensional projections for instant AI
Researchers have introduced VoodooNet, a novel neural network architecture that bypasses traditional iterative training methods like stochastic gradient descent. Instead, it employs a non-iterative approach using high-d…
-
新的优化框架利用黎曼几何处理学习到的数据流形
研究人员引入了一个名为“等黎曼优化”的新框架,以应对在学习到的数据流形上执行优化任务所面临的挑战。该方法通过定义适用于学习到的几何形状的新凸性和单调性概念,扩展了经典的黎曼优化。所提出的等黎曼下降算法在 MNIST 等数据集上的聚类和求解逆问题等任务中取得了改进的结果。
-
新研究揭示隐式偏差驱动深度学习中的神经缩放定律
研究人员发现了两个新的动力学缩放定律,它们描述了神经网络性能如何随着训练过程中复杂性度量的变化而变化。这些定律在CNN和Vision Transformers等各种架构以及多个数据集上均有观察到,并在收敛时恢复了已建立的测试误差缩放定律。单层感知器的分析工作支持了这些发现,并通过基于梯度的训练引入的隐式偏差来解释这种现象。
-
Researchers simulate N-ary crossbar for efficient multibit neural inference
Researchers have developed a simulation framework for N-ary crossbar architectures to improve energy-efficient neural network inference through in-memory computing. Their simulated 4x4 crossbar array using 4-state magne…
-
Researchers use causal analysis to explain Binary Spiking Neural Networks
Researchers have developed a novel causal analysis framework for Binary Spiking Neural Networks (BSNNs), treating their spiking activity as a binary causal model. This approach allows for logic-based explanations of net…
-
量子自编码器增强视觉学习并防御对抗性攻击
研究人员开发了量子掩码自编码器(QMAEs),能够学习量子态中缺失的特征,在图像重建任务中表现优于标准的量子自编码器。此外,一个新的防御框架利用量子自编码器在量子分类器中净化对抗性样本,无需对抗性训练,显著提高了受攻击下的预测准确性。该框架还包括一个置信度指标,用于识别无法净化的样本。
-
Decoupled Descent: Exact Test Error Tracking Via Approximate Message Passing
Researchers have developed a new training algorithm called Decoupled Descent (DD) that aims to eliminate the generalization gap in parametric models. DD uses approximate message passing theory to cancel biases caused by…
-
新的联邦学习方法增强了对抗攻击的鲁棒性
研究人员开发了一种新的鲁棒联邦学习方法,可以抵御对抗攻击。该方法称为基于损失的客户端聚类,只需要服务器和一名客户端等两个诚实参与者即可有效运行。理论分析表明,即使在强拜占庭攻击下也存在有界的最优性差距,实验结果表明在多个基准测试中显著优于标准的和鲁棒的联邦学习基线。
-
New research proposes energy-first neural architecture design inspired by biological principles
Researchers have developed a new approach to neural architecture design called minAction.net, which prioritizes energy efficiency alongside accuracy. Through extensive experimentation across various datasets, they found…
-
New research shows sustained gradient alignment causes subliminal learning in AI models
A new research paper explores the phenomenon of "subliminal learning" in machine learning models, where a student model can unintentionally acquire traits from a teacher model even when trained on non-class data. The st…
-
新研究推动联邦学习在隐私和异构性方面的进展
研究人员正在开发新的方法来改进联邦学习,这是一种允许模型在不损害隐私的情况下对去中心化数据进行训练的技术。几篇论文介绍了处理数据异构性的新算法,例如用于随机森林的FedForest和用于物联网系统中客户端选择的VARS-FL。其他工作侧重于通过共识嵌入进行隐私保护推理以及用于联邦图神经网络的鲁棒方法。此外,正在探索新的理论框架来限制泛化误差并激励联邦环境中的客户端贡献。
-
Federated learning paper introduces new strategy for client disagreements
This paper introduces a new taxonomy and resolution strategy for handling client-level disagreements in Federated Learning (FL). The proposed method creates isolated model update paths to prevent cross-contamination and…
-
联邦学习进展在隐私、效用和公平性之间取得平衡
研究人员正在探索增强联邦学习(FL)隐私的高级技术,FL是一种在去中心化数据上进行模型训练的方法。一项研究比较了在瑞典医疗保健数据上用于心血管疾病风险建模的差分隐私(DP)和同态加密(HE),发现HE与集中式方法相当,但计算开销更高,而DP在某些模型上表现出更大的性能下降。另一种方法FedPF引入了一种差分隐私的公平FL算法,通过将公平性和效用视为竞争目标来平衡它们,在具有竞争力的准确性和低计算占用的情况下显著减少了歧视。第三篇论文将…
-
Learn&Drop方法通过丢弃层将CNN训练时间减半
研究人员开发了一种名为Learn&Drop的新颖方法来加速卷积神经网络(CNN)的训练。该技术在训练过程中动态评估层参数变化,并通过丢弃未积极学习的层来缩小网络规模。与专注于推理压缩或反向传播优化的现有方法不同,Learn&Drop的目标是减少训练过程中的前向传播操作。在MNIST、CIFAR-10和Imagenette数据集上的VGG和ResNet架构上进行的实验表明,该方法可以在不显著损失准确性的情况下将训练时间缩短一半以上。
-
自监督网络在可比准确率下产生更少的线性区域
一项发表在arXiv上的新研究调查了自监督深度ReLU网络中线性区域的复杂性。研究人员发现,自监督学习方法在达到相似准确率的情况下,与监督方法相比产生的线性区域更少。研究还观察到,对比学习方法会随着时间的推移扩展这些区域,而自蒸馏方法会合并它们,并且这些几何特性可以指示表征质量并检测模型崩溃的早期迹象。
-
Recovery Guarantees for Continual Learning of Dependent Tasks: Memory, Data-Dependent Regularization, and Data-Dependent Weights
Researchers have developed Functional Task Networks (FTN), a novel continual learning method inspired by the mammalian neocortex. FTN uses a self-organizing binary mask to isolate parameters for different tasks, prevent…
-
LTBs-KAN offers faster, more efficient Kolmogorov-Arnold Networks
Researchers have introduced LTBs-KAN, a novel variant of Kolmogorov-Arnold Networks (KANs) designed to overcome the significant speed limitations of their predecessors. This new architecture achieves linear time complex…
-
New research suggests fine-tuning regimes significantly impact continual learning evaluations
A new paper argues that the fine-tuning regime, specifically the trainable parameter subspace, is a critical variable in evaluating continual learning methods. Researchers found that the relative performance rankings of…
-
新的 GEM 激活函数提供了比 ReLU 更平滑、更具理性的替代方案
研究人员推出了一种名为 Geometric Monomial (GEM) 的新型激活函数族,专为深度神经网络设计。这些函数采用纯粹的有理数算术,并提供 $C^{2N}$-平滑性,旨在克服标准 ReLU 的局限性。实验表明,GEM 变体在 CIFAR-10、CIFAR-100、MNIST、GPT-2 和 BERT-small 等各种基准测试中,其性能可媲美甚至超越 GELU 等成熟函数。
-
新研究质疑平坦最小值,提出拓扑忠实降维方法
研究人员开发了 DiRe-RAPIDS,一种新的降维技术,与 UMAP 和 t-SNE 等现有方法相比,它能更好地保留高维数据的全局拓扑结构。DiRe-RAPIDS 在一个旨在评估噪声流形拓扑忠实度的新基准上进行了调优。在一个大型的 arXiv 论文嵌入数据集上,DiRe-RAPIDS 在可比的速度下,比 UMAP 保持了显著更多的拓扑结构。此外,还引入了一个新的框架,用于定量和可视化分析参数化投影方法的局部邻域不稳定性,并展示了其在…