PulseAugur
实时 20:11:08

阿里巴巴的Qwen发布图像评估模型

阿里巴巴的Qwen团队发布了Qwen-Image-Bench,这是一个用于评估文本到图像生成视觉效果的视觉语言模型。该模型在Qwen3.6-27B的基础上进行了微调,根据包括质量、美学、与提示的对齐度、现实世界保真度和创意生成在内的一套结构化、分层标准来评估图像。Qwen-Image-Bench以JSON格式输出其评估结果,并利用链式思考推理提供详细分数。 AI

影响 为文本到图像模型输出的自动评估提供了一个新工具,可能加速开发周期。

排序理由 这是一个用于评估的专用模型的发布,而不是一个通用前沿模型的发布。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

阿里巴巴的Qwen发布图像评估模型

报道来源 [1]

  1. r/LocalLLaMA TIER_1 Deutsch(DE) · /u/jacek2023 ·

    Qwen/Qwen-Image-Bench · Hugging Face

    <table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1tpww8m/qwenqwenimagebench_hugging_face/"> <img alt="Qwen/Qwen-Image-Bench · Hugging Face" src="https://external-preview.redd.it/hxuY2Qu0zFBUl3cIGarLcn2YwFTllgsqvblt-lm1I6g.png?width=640&amp;crop=smart&amp;aut…