研究人员推出了TECCI,这是一个旨在严格测试文本引导图像编辑模型的新基准。TECCI包含7,550个图像-编辑指令对,这些指令经过精心策划,旨在暴露当前AI编辑能力的弱点,特别是在涉及位置、运动和创造力的挑战性编辑方面。对领先模型在TECCI上的评估显示,没有一个模型的成功率超过22%,其中Nano Banana Pro表现最佳,但所有模型在最小编辑和视觉质量方面比在指令遵循方面遇到的困难更大。 AI
影响 TECCI基准突显了当前AI图像编辑在复杂指令方面的显著局限性,表明需要改进指令遵循和视觉保真度。
排序理由 该集群描述了一篇介绍AI模型评估基准的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →