English(EN) Fashion Florence: Fine-Tuning Florence-2 for Structured Fashion Attribute Extraction

Fashion Florence 模型提取结构化服装属性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-11 00:04

研究人员开发了 Fashion Florence，这是一个基于 Florence-2 的视觉语言模型，专门针对从图像中提取结构化时尚属性进行了微调。该模型可以生成一个详细说明类别、颜色、材质、风格和场合标签的 JSON 对象，可直接供推荐和检索系统使用。在评估中，Fashion Florence 在类别和风格标签准确性方面优于 GPT-4o-mini 和 Gemini 2.5 Flash，同时还展示了其 0.77B 参数的高 JSON 输出有效性和效率。 AI

影响使时尚属性能够被推荐和检索系统直接以编程方式使用，从而改善电子商务运营。

排序理由该集群描述了一个基于现有架构的微调模型发布，包含性能基准和部署细节。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Hugging Face Daily Papers TIER_1 English(EN) · 2026-05-11 00:04

时尚佛罗伦萨：微调 Florence-2 以进行结构化时尚属性提取

We present Fashion Florence, a Florence-2 vision-language model fine-tuned with LoRA to extract structured fashion attributes from clothing images. Given a single photograph, the model generates a JSON object containing category, color, material, style tags, and occasion tags, st…

报道来源 [1]

时尚佛罗伦萨：微调 Florence-2 以进行结构化时尚属性提取

相关实体

相关话题