AI安全社区应优先为模型规范和宪法做出贡献,因为这些文件是公开的,并且不需要专门的机器学习知识。这种方法允许外部贡献者通过建议对自然语言文档进行更改来影响AI的行为,这些更改可以轻松地被实验室内部人士集成。关注这些规范被视为外部人士影响AI安全的可行方式,特别是在实验室可能忽略的宏观策略和威胁建模等领域。 AI
影响 为外部AI安全研究人员提供了一个通过可访问的文档影响模型行为的战略方向。
排序理由 该集群讨论的是外部AI安全研究人员的策略,而不是宣布新模型、研究发现或产品。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →