实体
Bloom
Bloom
PulseAugur coverage of Bloom — every cluster mentioning Bloom across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
GPT-2 Small 审计发现“加密密钥”特征与任务失败相关
研究人员开发了一种新颖的审计流程,用于分析GPT-2 Small语言模型的内部工作机制,特别是其在间接宾语识别(IOI)任务上的表现。该研究在模型的激活中识别出146个与任务失败相关的特征,其中一个突出的特征,标记为“加密密钥”,当提示中的宾语是“the keys”时,与错误表现出强烈的关联。尽管这一特征是重要的相关因素,但因果消融实验表明,在这一层面上它并非导致失败的充分原因,这凸显了理解模型行为的复杂性。
-
AI model evaluations are becoming a costly bottleneck, surpassing training expenses
AI model evaluations are becoming prohibitively expensive, with recent benchmarks costing tens of thousands of dollars and consuming thousands of GPU hours. This high cost is particularly pronounced for agent-based eval…