PulseAugur
实时 08:44:02
English(EN) CreativeBench: Benchmarking and Enhancing Machine Creativity via Self-Evolving Challenges

CreativeBench 基准测试评估和增强机器创造力

研究人员推出了 CreativeBench,这是一个旨在评估和增强机器创造力的新基准测试,特别是在代码生成方面。该基准测试利用认知框架,并包含两个子集 CreativeBench-ComboCreativeBench-Explore,以评估组合创造力和探索性创造力。一个关键发现是,虽然模型规模的扩大可以提高组合创造力,但可能导致探索性创造力的收益递减,并倾向于“通过规模化收敛”,使模型更正确但发散性更差。为解决此问题,该论文提出 EvoRePE,一种通过整合进化搜索模式来提高机器创造力的策略。 AI

影响 引入了一个评估机器创造力的新基准测试,有可能指导未来模型开发朝着更具发散性和探索性的能力发展。

排序理由 该集群包含一篇介绍机器创造力新基准测试和评估方法的 ist 研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Zi-Han Wang, Lam Nguyen, Zhengyang Zhao, Mengyue Yang, Chengwei Qin, Yujiu Yang, Linyi Yang ·

    CreativeBench: Benchmarking and Enhancing Machine Creativity via Self-Evolving Challenges

    arXiv:2603.11863v2 Announce Type: replace Abstract: The saturation of high-quality pre-training data has shifted research focus toward evolutionary systems capable of continuously generating novel artifacts, leading to the success of AlphaEvolve. However, the progress of such sys…