研究人员开发了 ReSAGE-PAR,一个旨在通过利用扩散模型进行图像合成来增强行人属性识别 (PAR) 的新流程。该方法解决了训练数据与监控图像之间的域差距以及生成幻觉的风险等挑战。ReSAGE-PAR 适配扩散模型以针对目标分辨率,并使用视觉-语言对齐分数生成可靠的伪标签,显著提高了 PAR 性能。 AI
影响 通过利用生成模型实现可扩展、高保真的数据集扩展,从而增强了行人属性识别能力。
排序理由 该集群包含一篇详细介绍一种新计算机视觉方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →