实体 Qwen 2.5-3B

Qwen 2.5-3B

PulseAugur coverage of Qwen 2.5-3B — every cluster mentioning Qwen 2.5-3B across labs, papers, and developer communities, ranked by signal.

总计 · 30天

4

90 天内 4

发布 · 30天

0

90 天内 0

论文 · 30天

3

90 天内 3

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 4 条

TOOL · CL_100099 · Jun 19 · 04:00

新的LoRA技术大幅降低了边缘设备上LLM微调的内存需求

一篇新的研究论文详细介绍了使用LoRA在边缘设备上微调大型语言模型（LLM）所需的内存显著减少的技术。这些方法包括基础模型量化、内存高效检查点、softmax近似和logits掩码。实验表明，这些技术可以将峰值内存使用量减少高达28倍，从而能够在资源受限的硬件上微调Llama 3.2 3B和Qwen 2.5 3B等模型。
TOOL · CL_48801 · May 25 · 04:00

强化学习优化知识图谱检索以用于LLM

研究人员开发了KG-R1，一个利用强化学习优化知识图谱检索增强生成（KG-RAG）系统的新框架。与采用固定多大型语言模型（LLM）模块管道的现有方法不同，KG-R1使用单个智能体学习与知识图谱交互。这种方法通过将检索和生成整合到统一流程中，降低了推理成本并提高了准确性，即使在使用Qwen 2.5-3B等较小模型时也是如此。该框架还表现出强大的可迁移性，无需重新训练即可在未见过的知识图谱上保持性能。
TOOL · CL_23818 · May 9 · 05:03

开发者微调Qwen 3B模型以复制个人写作风格

一位开发者创建了一个定制AI系统来模仿其个人写作风格，克服了提示工程的局限性。该系统采用双模型架构：一个像Claude Opus或Llama 70B这样的前沿LLM用于内容生成和事实基础，然后由一个微调后的Qwen 2.5 3B模型以开发者的特定语调重写输出。这种方法利用了开发者23年来收集的75,329条个人写作样本，以实现标准模型难以复制的独特风格匹配。
RESEARCH · CL_15892 · May 4 · 08:51

新方法在解码时消除大型语言模型偏见，无需重新训练即可提高公平性

研究人员开发了一种新颖的方法，可以在解码阶段减轻大型语言模型的偏见，而无需更改模型的权重。该方法使用单独的过程奖励模型（PRM）对公平性和流畅性的 token 候选进行评分。顺序批评和修订方案被证明是最有效的，将偏见分数提高了高达 0.40，同时保持了流畅性。该框架在包括 GPT-4o-mini、Llama 3.2 3B、Gemma 3 4B 和 Qwen 2.5 3B 在内的模型上进行了评估。