由卡内基梅隆大学(CMU)的 Tianqi Chen 领导的机器学习编译(MLC)小组正在开发 MLC Chat 和 Web LLM 等框架,以支持在包括 iPhone 和网页浏览器在内的消费级硬件上运行大型语言模型。该计划旨在通过允许模型在配备 AMD 显卡甚至仅 CPU 的设备上本地运行,来缓解当前的 GPU 短缺问题。Hugging Face 的 text-to-webapp 生成器和 Gradio 等项目也在为开发者和最终用户更轻松地部署和访问机器学习模型做出贡献。 AI
排序理由 该集群讨论的是用于更广泛可访问性的机器学习编译框架和工具的研究与开发,而非特定的前沿模型发布或重大的行业转变。
- AMD
- Apache TVM
- CMU
- Gradio
- Hugging Face
- LLaMA-70B
- MLC
- MLC Chat
- MLCommons
- MLPerf
- NVIDIA
- OctoML
- Tianqi Chen
- Web LLM
- XGBoost
AI 生成摘要 · Google Gemini · 来自 8 个来源。 我们如何撰写摘要 →