研究人员开发了一项为期18个月的挑战性测试,旨在衡量人工智能系统的智能。由于之前的人工智能基准很快就被超越,因此创建了该测试。这项新的、更严格的评估旨在提供对人工智能能力的更准确、更持久的评估。 AI
影响 这个新基准可以提供对人工智能进展更准确、更持久的衡量标准,从而指导未来的发展。
排序理由 该集群描述了创建新的人工智能基准,属于研究范畴。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →