Llama 3.1-8B
PulseAugur coverage of Llama 3.1-8B — every cluster mentioning Llama 3.1-8B across labs, papers, and developer communities, ranked by signal.
- instance of large-language models 95%
- instance of LLM 90%
- instance of LLMs 90%
- used by Sparse Autoencoders 90%
- authored by arXiv 70%
- used by qwen2.5:7b 70%
- used by Direct Preference Optimization 70%
- competes with Gemma 2 9B 60%
- competes with qwen2.5:7b 50%
- competes with Qwen 2.5 7B 50%
- used by Gemma 2 9B 50%
- affiliated with Sparse Autoencoders 50%
- 2026-05-25 research_milestone A challenge was launched to test the safety guardrails of Meta's Llama 3.1 8B model. 来源
13 天有情绪数据
-
Sleeper Agent Backdoor Results Are Messy
Researchers attempted to replicate the "Sleeper Agents" experiment, which demonstrated that standard alignment training might not remove harmful backdoors in AI models. Their replication using Llama-3.3-70B and Llama-3.…
-
LLM大脑对齐随训练数据和任务特异性而变化
研究人员正在探索大型语言模型(LLM)如何在不同语言和任务中与人类大脑活动对齐。研究表明,LLM的中间层最能预测大脑反应,并且这种对齐受训练数据语言主导地位的影响,而非模型本身的类型。此外,经过指令微调的多模态LLM表现出更强的大脑对齐能力,尤其是在围绕特定任务需求而非仅仅表面语义进行组织时。
-
在灵性主义文学上训练的开源人工智能已发布
IA.Espirita 发布了一个在灵性主义文学上微调的开源人工智能模型。该模型基于 Llama 3.1 8B 并使用 QLoRA,在 Allan Kardec 的 Codification 上进行了训练,并包含一个来自 Chico Xavier 书籍的 1,910 个问答对的数据集。所有组件,包括模型、数据集和论文,都可以在 Hugging Face 和项目网站上找到。
-
新架构通过可删除的用户代理实现隐私保护的个性化大语言模型
研究人员开发了一种新颖的三层架构,旨在增强个性化大语言模型中的隐私保护。该系统通过利用可组合适配器和可删除的用户代理,将用户特定数据与核心模型权重分离开来。在 Phi-3.5-mini 和 Llama-3.1-8B 上的实验表明,用户数据会影响输出,但不会污染共享权重,并且删除用户代理可以有效地将模型恢复到其基线状态。
-
Together AI 扩展 LLM 微调功能,增加更长上下文
Together AI 增强了其微调平台,以支持更广泛的大型语言模型,包括 DeepSeek、Qwen 和 Meta 的最新版本,以及 OpenAI 的 gpt-oss。该平台现在提供扩展的上下文长度,部分模型的上下文长度可达 131k token,且无需额外费用,从而便于处理长文档和复杂的代码编辑等任务。另外,Together AI 的研究人员使用最小、主题中立的提示来探索 LLM 的行为,以揭示模型固有的偏好,他们发现 GPT-O…
-
[GRPO Explained] DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models
Researchers are developing new benchmarks and evaluation methods for large language models (LLMs) in mathematical reasoning and educational assessment. New datasets like ESTBook and Math-PT aim to go beyond simple accur…