一项新的研究论文指出,大型语言模型生成的故事存在严重的多样性不足。研究发现,包括 Elias 等名字和灯塔等场景在内的 11 个词语,在四个不同模型生成的故事中几乎占了 90%。这些词语在普通文学中并不常见,但在可能用于模型对齐的偏好数据集中却很普遍,这表明这些数据集和对齐技术可能不成比例地影响模型输出,导致叙事重复。 AI
影响 强调了偏好数据和对齐技术如何导致 LLM 生成的内容输出重复,可能影响创意应用。
排序理由 该集群包含一篇详细介绍 LLM 行为研究结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →