English(EN) Long-Term Simulation Exposes Cognitive-Developmental Risks in AI Companions

新的AI安全框架揭示AI伴侣的长期风险

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-24 04:46

一个名为TSJ（Theater-Stage-Judge）的新框架已被开发出来，用于评估AI伴侣相关的长期认知发展风险，特别是对儿童和青少年等用户而言。与现有的短期测试不同，TSJ模拟了长时间的互动，以揭示随着时间推移而出现的风险。在一项涉及六个主流模型的研究所中，TSJ发现短期测试显著低估了这些风险，在模拟关系中大约140轮互动后才出现稳定的估计值。该框架确定幼儿期和新兴成年期是最脆弱的阶段，认知信任和情感依赖是最薄弱的领域。 AI

影响这项研究强调了AI安全中进行纵向测试的必要性，并表明当前的评估可能遗漏了对弱势用户至关重要的长期风险。

排序理由该集群描述了一个新的研究框架及其在评估AI安全方面的应用。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Hugging Face Daily Papers TIER_1 English(EN) · 2026-06-24 04:46

Long-Term Simulation Exposes Cognitive-Developmental Risks in AI Companions

AI companions powered by large language models increasingly interact with cognition-developing users, including children and adolescents, creating risks that may accumulate over time. Existing safety evaluations largely rely on single-turn or short-session tests, which cannot cap…

报道来源 [1]

Long-Term Simulation Exposes Cognitive-Developmental Risks in AI Companions

相关实体

相关话题