研究人员推出了 CreativeBench,这是一个旨在评估和增强机器创造力的新基准测试,特别是在代码生成方面。该基准测试利用认知框架,并包含两个子集 CreativeBench-Combo 和 CreativeBench-Explore,以评估组合创造力和探索性创造力。一个关键发现是,虽然模型规模的扩大可以提高组合创造力,但可能导致探索性创造力的收益递减,并倾向于“通过规模化收敛”,使模型更正确但发散性更差。为解决此问题,该论文提出 EvoRePE,一种通过整合进化搜索模式来提高机器创造力的策略。 AI
影响 引入了一个评估机器创造力的新基准测试,有可能指导未来模型开发朝着更具发散性和探索性的能力发展。
排序理由 该集群包含一篇介绍机器创造力新基准测试和评估方法的 ist 研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →