实体 Gemma 2B

Gemma 2B

PulseAugur coverage of Gemma 2B — every cluster mentioning Gemma 2B across labs, papers, and developer communities, ranked by signal.

总计 · 30天

6

90 天内 14

发布 · 30天

0

90 天内 0

论文 · 30天

4

90 天内 10

层级分布 · 90 天

significant 1
research 5
tool 8

主题

关系

情绪 · 30 天

3 天有情绪数据

最近 · 第 1/1 页 · 共 14 条

TOOL · CL_140894 · Jul 14 · 01:14

在本地运行Google Gemma LLM的最佳GPU

对于希望在本地运行Google Gemma模型的用户来说，GPU的选择很大程度上取决于具体的模型大小。Gemma 2B和7B等较小版本可以在具有8-16GB显存的GPU上有效运行，其中RTX 4060 Ti 16GB被认为是性价比高的理想选择。Gemma 27B等较大模型需要至少24GB的显存，因此需要RTX 4090或二手RTX 3090等高端选项才能获得最佳性能和质量。
TOOL · CL_104122 · Jun 22 · 17:52

Python 库 freeaiagent 为应用程序集中式集成 LLM

一个名为 freeaiagent 的新 Python 库简化了将大型语言模型集成到应用程序中的过程。它充当本地 HTTP 服务，允许 Flask、Django 或 CLI 工具等各种应用程序连接到单个 AI 后端。这种方法集中了模型选择、上下文管理和工具调用等问题，消除了每个应用程序单独处理这些复杂性的需要。该库支持通过 llamafile 的本地模型和 Ollama、Groq 和 Gemini 等云提供商，并内置了用于增强可靠性的回退机制。
RESEARCH · CL_98104 · Jun 16 · 18:28

新框架认证语言模型中稀疏自编码器的可解释性

研究人员开发了一个新框架，用于认证稀疏自编码器（SAE）在语言模型中使用时的可解释性。该框架通过使用源自 SAE 重构的稀疏代理来确定语言模型的风险上限。该方法已被证明在 GPT-2 Small、Gemma-2B 和 Llama-3-8B 等模型上有效，其中 Llama-3-8B 的后期层更容易认证。该方法有助于区分真正的语义对齐与纯粹的统计稀疏性，为基于 SAE 的解释的可靠性提供了一个诊断工具。
TOOL · CL_93467 · Jun 16 · 04:00

CPU 级分类器提供经济高效的 LLM 安全执行

一篇新的研究论文提出了 GuardChain，这是一个用于 LLM 部署的三阶段安全流水线，可显著减少对昂贵 GPU 基础设施的依赖。研究表明，CPU 级分类器可以有效地处理大部分分布内提示，以较低的成本实现接近峰值的准确率。虽然 CPU 分类器在处理分布外和对抗性混淆的输入时遇到困难，但提出的 GuardChain 流水线将它们与基于 GPU 的模型集成，以恢复这些失败，从而提供一种更具成本效益的大规模 LLM 安全执行方法。
RESEARCH · CL_48863 · May 22 · 16:24

语言模型中的概念几何源于词语共现

一篇新的研究论文提出了一个分布理论，解释了像“is-a”关系这样的分层概念如何在语言模型中以几何方式表示。研究表明，词语共现统计数据的谱组织自然地导致了嵌入中的分层分裂几何。这种现象在word2vec嵌入中被观察到，并且也扩展到了Gemma 2B的解嵌入，这表明复杂的概念层次结构可以从基本的统计模式中涌现，而无需专门的机制。
TOOL · CL_34399 · May 16 · 11:01

Gemma 2B 本地LLM在一周野外测试中表现出色

一位用户在一周内测试了Gemma 2B本地LLM，发现它是完成任务的“相当不错的”工具。该评估表明该模型在实际、真实场景中表现良好。
TOOL · CL_32376 · May 14 · 20:00

小型Gemma 2B模型在AI对齐审计中显示出潜力

研究人员探索了使用一个小型、专业化的Gemma 2B模型作为审计AI对齐的裁判。该模型经过特定代码示例的训练，能够识别其他模型响应中的域外不一致性，这是Sonnet 4.5等大型模型难以完成的任务。尽管需要进一步研究，但这些发现表明，狭窄、专业化的分类器可能为审计已部署的AI系统提供一种更具成本效益和透明度的方法，作为现有方法的补充。
SIGNIFICANT · CL_31066 · May 14 · 06:56

Google I/O：发布 Gemini 1.5 Pro、Gemma 2 和 Genkit 框架

Google 在其 I/O 2024 大会上发布了一系列旨在简化 AI 开发的 AI 工具和模型。该公司推出了具有 200 万 token 上下文窗口的 Gemini 1.5 Pro，能够对海量数据进行推理，以及用于快速、大批量任务的 Gemini 1.5 Flash。此外，Google 还发布了 Gemma 2，这是一个开源模型系列，其 27B 参数变体可与更大的专有模型相媲美，以及 Firebase Genkit，一个用于简化 A…
TOOL · CL_18538 · May 6 · 04:00

PERSA管道使用RLHF使大型语言模型反馈与教师风格保持一致

研究人员开发了PERSA，这是一种使用人类反馈强化学习（RLHF）来调整大型语言模型以生成个性化教育反馈的新方法。该方法专门针对将大型语言模型的反馈风格与特定教师的风格保持一致，同时不损害诊断准确性。通过仅更新顶部的Transformer块及其投影，PERSA增强了风格可控性，同时保持内容正确性，在代码反馈基准测试中取得了高分。
TOOL · CL_15950 · May 5 · 04:00

研究人员开发SNMF用于可解释的LLM特征分析

研究人员开发了一种新方法，通过分解MLP激活来理解大型语言模型的内部工作原理。这种技术，半非负矩阵分解（SNMF），识别出稀疏组合的共激活神经元的可解释特征，并将它们映射到激活它们的输入。在Llama 3.1、Gemma 2和GPT-2等模型上的实验表明，SNMF衍生的特征在因果控制方面比现有方法更有效，揭示了模型激活空间中的分层结构。
RESEARCH · CL_16137 · Apr 30 · 18:22

AI安全研究探讨LLM的越狱成功和涌现式错位问题

两篇新研究论文探讨了大语言模型中AI安全失败的根本原因。一篇论文介绍了LOCA，一种提供局部因果解释的方法，用于说明为何特定的越狱提示会成功，并证明该方法能以比先前方法更少的改动诱导模型拒绝。第二篇论文提出了一个关于涌现式错位的几何解释，认为在特定任务上进行微调可能会由于模型表示中的特征叠加，无意中放大附近有害的特征。
RESEARCH · CL_06787 · Apr 28 · 04:00

新研究发现“覆盖差距”是大型语言模型适应中的关键失败因素

研究人员在基于超网络的适应大型语言模型的方法中发现了一种知识冲突失败，当新信息与预先存在的知识相冲突时，准确性会显著下降。这种失败归因于一个幅度问题，即适配器的影响始终小于预训练模型的知识，尤其是在深度冲突的事实时。该研究提出了两种无需训练的解决方案：选择性层增强（Selective Layer Boosting）和冲突感知内化（Conflict-Aware Internalization），它们在不牺牲新知识回忆能力的情况下提高了对…
RESEARCH · CL_06752 · Apr 28 · 04:00

研究人员开发新方法来消除大型语言模型（LLM）奖励模型的偏差并改进其性能

研究人员开发了新的方法来提高用于对齐大型语言模型（LLM）的奖励模型（RM）的可靠性和可解释性。一种方法引入了因果驱动的干预技术，以在推理时减轻 RM 中的各种偏差，显示出对虚假特征的敏感性降低，而没有性能权衡。另一项开发是“reward-lens”库，它将机制可解释性工具应用于 RM，揭示线性归因并不总是能预测因果打补丁的效果。此外，一种称为时间连贯奖励建模（TCRM）的新方法将 RM 视为价值函数，从而能够进行可解释的 token…
RESEARCH · CL_01620 · Oct 10 · 00:00

Google DeepMind发布T5Gemma编码器-解码器LLM，改编自Gemma

Google DeepMind推出了T5Gemma，这是一个新的编码器-解码器大型语言模型系列，源自其现有的Gemma 2模型。这种改编技术允许灵活组合编码器和解码器的大小，从而在模型质量和推理效率之间取得更好的平衡。实验表明，T5Gemma模型在各种基准测试中的表现与同类仅解码器的Gemma模型相当或更优，在数学推理和阅读理解等任务中提供了显著的速度和准确性优势。