Lora
PulseAugur coverage of Lora — every cluster mentioning Lora across labs, papers, and developer communities, ranked by signal.
- used by Vít 90%
- instance of Low Rank Adaptation 90%
- used by large-language models 70%
- used by peft 70%
- instance of Direct Preference Optimization 70%
- used by Glue 70%
- used by magazine 70%
- used by supervised fine-tuning 70%
- developed large-language models 70%
- used by Bert 70%
- used by Dopravní podnik Ostrava 70%
- used by Transformer Reinforcement Learning 70%
- 2026-05-12 research_milestone A paper is published detailing findings on parameter placement in LoRA for fine-tuning. 来源
16 天有情绪数据
-
AI 飞轮将印度语言 ASR 的小众实体识别准确率提高了 17 倍
研究人员开发了一种新颖的文本到语音 (TTS) 和语音到文本 (STT) 系统,称为“TTS-STT 飞轮”,以提高印度语言小众领域的自动语音识别 (ASR) 准确性。该系统合成实体密集型音频,成本低于 50 美元,然后用于微调现有模型。微调后的模型在泰卢固语的实体命中率 (EHR) 方面取得了显著改进,性能优于开源和商业系统。
-
Researchers distill DeepSeek-R1 reasoning into compact models for code clone detection
Researchers have developed a knowledge distillation framework to improve the reliability and practicality of compact open-source models for cross-language code clone detection. This method transfers reasoning capabiliti…
-
团队利用 LLM 和集成方法进行 SemEval-2026 多语言在线极化检测
研究人员为 SemEval-2026 Task 9 开发了系统,这是一项涵盖 22 种语言的多语言极化检测挑战。一种方法使用低秩适配 (LoRA) 微调 Gemma 3 模型,并使用了 GPT-4o-mini 生成的增强数据,取得了 0.811 的平均宏 F1 分数,位列第二。另一种方法侧重于使用 QLoRA 和数据增强技术(如匿名化和同形异义词替换)来微调中型 LLM,以提高鲁棒性。
-
音频语言模型在构音障碍语音语境下表现不佳,但微调显示出希望
研究人员开发了一个基准测试,用于检验当前的音频语言模型是否能有效利用额外的临床背景信息来改进构音障碍语音的自动语音识别。初步研究表明,这些模型并未从诊断标签或详细的临床描述中获得显著益处,某些提示甚至会降低性能。然而,使用临床背景信息进行微调显示出希望,对于唐氏综合征等特定亚组,词错误率得到了显著降低。
-
New methods like SMF and SAM reduce catastrophic forgetting in LLMs
Two new research papers explore methods to mitigate catastrophic forgetting in language models during fine-tuning. One paper introduces Sparse Memory Finetuning (SMF), which adds memory layers and updates only heavily a…
-
Flexi-LoRA 动态调整 LLM 参数以实现高效微调
研究人员开发了 Flexi-LoRA,一种用于微调大型语言模型的新方法,该方法根据输入复杂性动态调整模型的参数。这种方法可以实现更有效的适应,特别是对于需要复杂推理或语音处理的任务。实证研究表明,Flexi-LoRA 在使用更少参数的同时实现更高的性能和更好的指令遵循能力,优于传统的静态 LoRA 方法。
-
Flexi-LoRA 针对语音和推理任务调整微调秩
研究人员推出 Flexi-LoRA,一个旨在增强大型语言模型参数高效微调的新框架。该方法在训练和推理阶段根据输入数据的复杂性动态调整 LoRA 秩。在包括问答、数学推理和语音处理在内的各种任务上的实证研究表明,与静态 LoRA 相比,Flexi-LoRA 在参数更少的情况下实现了更优越的性能,尤其是在需要复杂推理链的任务上。
-
DeepSeek 的 V4 模型省略了 Engram 记忆模块,引发了讨论和新研究
DeepSeek 最新的 V4 模型显著省略了 Engram,这是一个与北京大学共同开发的创新记忆和效率模块。Engram 的设计目的是通过允许直接知识查找而不是重新计算静态信息来增强 Transformer,人们曾预计它将成为 V4 的基础组成部分。尽管 Engram 未包含在 V4 中,但其原理正在后续研究中被探索,包括用于多机部署的 CXL 内存池、其哈希机制的实验验证以及向视觉模态的适应。
-
Flux.2 Klein LoRA模型支持新的“涂鸦式”AI艺术风格
新的LoRA模型Flux.2 Klein 9B和4B使艺术家能够生成具有精细控制的“涂鸦式”AI艺术。这些模型经过大量手绘示例的训练,有望通过提供新的风格迁移和字体生成工具来改变数字艺术创作。
-
Phosphene AI 视频工具增加了 LoRA 支持,可在 16GB RAM 的 Mac 上运行
开源 AI 视频生成工具 Phosphene 已快速更新,支持 LoRA 和 CivitAI 集成,允许用户应用自定义 LoRA 模型,如 Retro anime LoRA。此外,还出现了在内存仅为 16GB 的 Mac 上运行 Phosphene 和 LTX-2.3 的技巧,可在几分钟内使用 M1 Max 芯片生成视频。
-
FLUX.2 LoRA 使用苏联火柴盒艺术每日生成 2,880 只 AI 动物
一个创意 AI 项目利用 FLUX.2 LoRA 模型,该模型在苏联火柴盒标签扫描件上进行训练,每日生成约 2,880 张独特的动物图像。该系统在 vast.ai 上持续运行,探索复古宣传美学与现代生成艺术的交叉点。该项目还深入探讨了这种文本到图像技术的艺术和伦理影响。
-
新研究探讨了视频扩散模型的3D一致性、LoRA可迁移性以及统一框架。
研究人员开发了使用扩散模型改进视频生成的新方法。一种方法“几何强制”(Geometry Forcing)将3D表示与视频扩散模型相结合,以增强几何一致性和视觉质量。另一个框架UniVidX通过调整扩散先验以适应各种任务和模态(包括内建图和RGBA图层),实现了多模态视频生成的统一。此外,还提出了一种名为“聚类感知谱仲裁”(Cluster-Aware Spectral Arbitration, CASA)的无数据方法,以解决将LoRA迁…
-
RadLite微调小型LLM,用于CPU可部署的放射学AI
研究人员开发了RadLite,一种用于放射学任务的30-40亿参数小型语言模型(SLM)微调方法。该方法利用Qwen2.5-3B-Instruct和Qwen3-4B等模型的LoRA微调,显著提高了九种不同放射学应用的性能。所得模型足够小,可以量化并在消费级CPU上部署,为资源受限的临床环境提供了实用的解决方案。
-
研究人员提出弗雷歇平均用于对称感知模型合并
研究人员开发了一种新的模型合并方法,该方法考虑了架构对称性,而朴素的参数平均法通常会忽略这一点。所提出的方法将合并视为弗雷歇平均,利用适当流形上的测地线距离来定义模型接近度。这个通用框架包含了诸如Fisher合并等现有技术,并通过考虑低秩适配器(LoRA)特定的商流形几何结构,为合并LoRA提供了一种实用的算法。
-
RoundPipe 实现了在消费级 GPU 上高效进行 LLM 微调
研究人员开发了 RoundPipe,这是一种新的流水线调度方法,旨在提高在消费级 GPU 上微调大型语言模型的效率。该方法通过以循环方式动态调度设备上的计算阶段来解决现有方法的局限性,从而有效地消除流水线气泡并提高吞吐量。评估显示,与当前基线相比,速度有了显著提升,使得在单台服务器上微调非常大的模型成为可能。RoundPipe 也作为一个开源库提供。
-
New research explores methods to prevent catastrophic forgetting in AI models
Multiple research papers submitted on May 6, 2026, explore novel approaches to continual learning across various AI domains. One paper introduces a replay-based strategy for physics-informed neural operators to mitigate…
-
REALM框架对齐RGB和事件相机数据以实现跨模态感知
研究人员开发了REALM,一个新颖的跨模态框架,旨在将RGB和事件相机数据对齐到一个共享的潜在流形中。该方法将事件表示投影到预训练的RGB基础模型的潜在空间中,并利用低秩自适应(LoRA)来弥合模态差距。REALM能够将图像训练的解码器零样本应用于事件流,用于深度估计和语义分割等任务,并在宽基线特征匹配中取得了最先进的成果。
-
New PARA method slashes LoRA parameters by 90% while preserving performance
Researchers have developed a new method called Post-Optimization Adaptive Rank Allocation (PARA) to compress LoRA, a technique used for efficient fine-tuning of large AI models. PARA addresses the issue of parameter red…
-
Anthropic 新型“内省适配器”让大语言模型能够自我报告行为
研究人员开发了一种名为“内省适配器”(Introspection Adapters, IA)的新颖技术,该技术允许大型语言模型报告其自身学到的行为,包括隐藏的偏见和加密的恶意指令。该方法使用轻量级的 LoRA 插件将模型的内部状态转换为自然语言,从而有效地实现自我报告。在评估中,IA 的表现显著优于现有的黑箱和白箱审计方法,标志着 AI 安全从外部审问转向内部坦白。
-
阿里巴巴的 HappyHorse 1.0 领跑 AI 视频生成,新的 GPT 模型和工具涌现
阿里巴巴发布了 HappyHorse 1.0,这是一个开源的 AI 视频生成器,能够生成带有同步音频的 1080p 视频。该模型由一个拥有 150 亿参数的 Transformer 驱动,被誉为顶级的 AI 视频生成器,可以根据文本提示或图像创建电影级内容。它还支持多语言唇形同步,并提供商业许可,用户还可以免费获得每日积分进行试用。