PulseAugur
实时 19:51:21
实体 Marco Somma

Marco Somma

PulseAugur coverage of Marco Somma — every cluster mentioning Marco Somma across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_85890 ·

    大型语言模型(LLM)表现出相关性故障,削弱了独立验证的有效性

    一项测试Groq的Llama 3.1 8B和OpenRouter的Gemma 4 31B两个大型语言模型(LLM)作为独立验证器的实验显示,它们在故障模式上存在显著的相关性。在受到“越狱”提示时,两个模型分别表现出50%和36%的脆弱性,并且导致它们失败的提示类型存在明显的重叠。这表明,由于共享的训练数据和对齐技术,使用多个LLM并不能保证安全性和可靠性成比例地提高。