一篇新论文评估了190个开源视觉语言模型(VLMs)在杂货商品检索任务上的表现,这是无收银零售的关键组成部分。研究发现,数据质量比模型规模对提高准确性更重要。该研究还强调,如果使用更清洁的数据进行训练,较小、高效的模型可以优于较大的模型,并引入了一个名为“语义功率密度”的新指标来衡量模型效率。尽管在召回相关商品方面表现强劲,但目前最先进的模型在精确排序视觉上相似的产品方面仍存在困难。 AI
影响 确定了使用开源VLMs提高杂货商品检索准确性的关键因素,可能对零售自动化产生影响。
排序理由 学术论文评估开源模型在特定任务上的表现。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →