Core Ml
PulseAugur coverage of Core Ml — every cluster mentioning Core Ml across labs, papers, and developer communities, ranked by signal.
5 天有情绪数据
-
开发者构建本地机器学习流水线以阻止有风险的代码提交
一位最近的计算机科学毕业生开发了一个本地机器学习流水线,旨在防止有风险的代码提交在推送之前被提交。该流水线集成了三个检查层:一个用于已知敏感信息格式的Rust正则表达式通道,一个用于更危险模式(如不安全子进程调用)的CoreML分类器,以及一个本地LLM(Qwen2.5-Coder),用于标记潜在的注入风险或死代码,但不会阻止提交。该项目目前仅限于Apple Silicon,因为它依赖于CoreML和MLX,旨在通过提供更细致的风险检…
-
ANEForge 支持 Apple Neural Engine 的直接 Python 编程
一个名为 ANEForge 的新 Python 包允许开发者直接对 Apple Neural Engine (ANE) 进行编程,而无需依赖 CoreML。这种绕过方式可以更有效地利用 ANE,ANE 是 Apple 设备中专用的神经网络加速器。ANEForge 将张量图编译成 ANE 程序,支持诸如融合注意力、各种权重格式,甚至直接在引擎上进行训练步骤等操作。这使得模型执行速度显著加快,例如 ResNet-18 前向传播仅需 0.3…
-
iOS 27 Siri 集成 WaveRNN 和 FastSpeech2 模型
据报道,iOS 27 中的 Siri 利用了 WaveRNN 和 FastSpeech2 模型,这些模型在模拟器的文件中被发现。这些模型以 espresso 格式集成,表明为设备端处理进行了优化部署。此外,还发现了一个用于音乐会排名(被识别为逻辑回归)的 CoreML 模型。
-
Apple 发布 CoreAI,用于 Apple Silicon 上的设备端推理
Apple 推出了 CoreAI,这是一款新的设备端推理引擎,旨在取代 CoreML,并为 MLX 和 llama.cpp 等现有框架提供替代方案。该引擎针对 Apple Silicon 进行了优化,特别是针对移动设备,并支持更大的模型,包括一个拥有 200 亿参数的基础模型。虽然性能比较尚待公布,但 CoreAI 旨在使更复杂的 AI 模型能够直接在应用程序中部署。
-
iPhone 大模型基准测试:Neural Engine 在持续性能上胜过 GPU
iPhone 17 Pro 上的端侧大模型性能测试表明,虽然 GPU 在初始生成速度上占优,但它们会迅速过热并降频。苹果的 Neural Engine 虽然启动较慢,但由于功耗显著降低,在长时间内能保持更一致的解码速率。这表明,对于需要持续大模型运行的应用,Neural Engine 是更高效且最终更快的选择,而 GPU 更适合快速、爆发式的交互。
-
MLX、LiteRT-LM 和 CoreML 在 iPhone 大模型性能方面进行基准测试
最近的一项基准测试在 iPhone 17 Pro 上测试了四种端侧大模型运行时,比较了解码速度和内存使用情况。对于 Qwen 3.5 2B 等通用模型,MLX 速度最快;而 LiteRT-LM 在 Gemma 4 E2B 模型上表现尤为出色。在内存受限的情况下,使用 Apple Neural Engine 的 CoreML 具有显著优势,消耗的 RAM 大大减少。
-
SDXL图像生成现已通过Off Grid应用在iPhone上运行
支持设备端AI图像生成的开源应用Off Grid已修复了阻止SDXL模型在iPhone上运行的bug。该问题源于应用验证代码仅识别单一UNet文件布局,而大多数SDXL模型使用分块布局。这一疏忽导致用户报告了数月的问题。此次修复允许用户在iPhone 15 Pro上无需网络连接,在约30-45秒内生成SDXL图像。
-
Claude Code 评估 iOS 应用性能,提出代码修复建议
一位 iOS 开发者使用 Anthropic 的 Claude Code 来评估其应用 HerdCount 的性能问题。该 AI 识别并建议修复了几个问题,包括低效的图像渲染、保存期间主线程阻塞以及次优的对象分配。Claude Code 生成了一个包含这些解决方案的 pull request,开发者发现这些方案在很大程度上是准确有效的,突显了 AI 在识别和解决繁琐的编码效率低下问题方面的实用性。
-
AI模型从音频预测口吃事件,并部署在设备上
研究人员开发了一种新的卷积神经网络(CNN)模型,该模型能够从短音频片段中预测即将发生的口吃事件。这个拥有616K参数的模型在SEP-28k数据集上进行了训练,在识别如阻塞和声音重复等严重口吃事件的前体方面表现出特别的能力。值得注意的是,该模型可以部署在设备上,并在各种Apple设备上展示了高效的导出格式和低延迟。