阿里巴巴的Qwen发布图像评估模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-28 07:57

阿里巴巴的Qwen团队发布了Qwen-Image-Bench，这是一个用于评估文本到图像生成视觉效果的视觉语言模型。该模型在Qwen3.6-27B的基础上进行了微调，根据包括质量、美学、与提示的对齐度、现实世界保真度和创意生成在内的一套结构化、分层标准来评估图像。Qwen-Image-Bench以JSON格式输出其评估结果，并利用链式思考推理提供详细分数。 AI

影响为文本到图像模型输出的自动评估提供了一个新工具，可能加速开发周期。

排序理由这是一个用于评估的专用模型的发布，而不是一个通用前沿模型的发布。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 Deutsch(DE) · /u/jacek2023 · 2026-05-28 07:57

Qwen/Qwen-Image-Bench · Hugging Face

<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1tpww8m/qwenqwenimagebench_hugging_face/"> <img alt="Qwen/Qwen-Image-Bench · Hugging Face" src="https://external-preview.redd.it/hxuY2Qu0zFBUl3cIGarLcn2YwFTllgsqvblt-lm1I6g.png?width=640&crop=smart&aut…

报道来源 [1]

Qwen/Qwen-Image-Bench · Hugging Face

相关实体

相关话题