PulseAugur
实时 09:15:36
实体 ChunkFT

ChunkFT

PulseAugur coverage of ChunkFT — every cluster mentioning ChunkFT across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
时间线
  1. 2026-05-20 research_milestone Publication of a paper detailing the ChunkFT memory-efficient fine-tuning framework. 来源
  2. 2026-05-20 research_milestone A new framework called ChunkFT was introduced for memory-efficient fine-tuning of large language models. 来源
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_49703 ·

    ChunkFT框架大幅降低Llama 3微调的内存需求

    研究人员开发了ChunkFT,一个旨在提高大型语言模型全参数微调内存效率的新框架。该方法允许在动态模型参数子集上进行梯度计算,从而减少对大量GPU内存的需求。使用Llama 3模型进行的实验证明了显著的内存节省,使得在消费级硬件上进行微调成为可能,并在各种下游任务上取得了与传统全参数微调方法相当或更优的性能。

  2. TOOL · CL_42500 ·

    ChunkFT框架大幅降低LLM微调的内存需求

    研究人员开发了ChunkFT,一个新颖的框架,旨在显著减少大型语言模型全参数微调所需的内存。该方法动态激活一组工作参数,无需改变模型架构即可在子张量上进行梯度计算。实验表明,ChunkFT可以在单个消费级GPU上微调Llama 3-8B等模型,在显著减少内存占用的同时,实现与传统全参数微调相当的性能。