一项新的研究论文探讨了多模态大型语言模型(LLMs)在没有预先训练的情况下评估视觉创造力的能力。该研究测试了包括Gemini 3 Flash、Gemma 4-31B-it和GPT-5.4 Mini在内的六个大型语言模型,对AI生成的图像和人类素描进行了评估。结果表明,这些模型能够与人类的创造力评分保持一致,相关性范围从.29到.68。虽然大型语言模型的逐步推理过程提供了对其评估标准的解释性,例如平衡原创性和质量,但这种推理并未增强其与人类判断的一致性。 AI
影响 多模态大型语言模型在零样本视觉创造力评估方面展现出潜力,为AI生成的艺术品和素描提供了可解释的推理。
排序理由 学术论文,详细介绍了关于大型语言模型能力的研究发现。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →