实体
GPT-2 XL
GPT-2 XL
PulseAugur coverage of GPT-2 XL — every cluster mentioning GPT-2 XL across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
New method speeds neural network compression via slice-wise distillation
Researchers have developed a new method for compressing neural networks called slice-wise feature distillation. This technique breaks down large models into smaller, manageable slices for independent tensorization, whic…
-
LLM大脑对齐随训练数据和任务特异性而变化
研究人员正在探索大型语言模型(LLM)如何在不同语言和任务中与人类大脑活动对齐。研究表明,LLM的中间层最能预测大脑反应,并且这种对齐受训练数据语言主导地位的影响,而非模型本身的类型。此外,经过指令微调的多模态LLM表现出更强的大脑对齐能力,尤其是在围绕特定任务需求而非仅仅表面语义进行组织时。