PulseAugur
实时 00:05:03
实体 Vision Banana

Vision Banana

PulseAugur coverage of Vision Banana — every cluster mentioning Vision Banana across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
3
90 天内 3
层级分布 · 90 天
最近 · 第 1/1 页 · 共 3 条
  1. RESEARCH · CL_20322 ·

    开源图像编辑器展现出惊人的零样本视觉能力

    研究人员评估了三个开源图像编辑模型——Qwen-Image-Edit、FireRed-Image-Edit 和 LongCat-Image-Edit——在没有任何微调的情况下进行零样本视觉学习的能力。研究发现,这些模型在深度估计、表面法线估计和语义分割等任务上表现出显著的视觉理解能力。值得注意的是,FireRed-Image-Edit 在表面法线估计任务上的表现与一个指令微调模型相当,而 Qwen-Image-Edit 和 LongC…

  2. RESEARCH · CL_04428 ·

    Google DeepMind 的 Vision Banana 统一了 AI 生成与感知

    Google DeepMind 的研究人员开发了 Vision Banana,这是一个基于 Nano Banana Pro 构建的模型,通过将图像转换为其他图像来处理视觉任务。这种方法迫使模型生成像素,从而赋予其对 3D 几何和深度的理解。因此,与专用模型相比,Vision Banana 在零样本分割和深度估计方面表现出卓越的性能。

  3. RESEARCH · CL_03244 ·

    Google DeepMind's Vision Banana shows image generators are generalist vision learners

    Google DeepMind researchers have presented evidence suggesting that image generation models can function as generalist vision learners. Their work, highlighted by the "Vision Banana" project, indicates these models poss…