PulseAugur
实时 15:24:50
English(EN) Vista 9B/4B from inclusionAI

inclusionAI 发布 Vista 9B/4B GUI 基础模型

inclusionAI 发布了 Vista 9BVista 4B,这是专为 GUI 基础设计的新的视觉语言模型。这些模型使用视图一致的 GRPO 方法和自验证的跨视图锚定进行训练,并基于 Qwen3.5 主干。这些模型将自然语言指令和屏幕截图映射到标准化框架内的点击坐标,从而实现对图形用户界面的精确交互。 AI

影响 这些模型推进了 GUI 基础能力,可能改善人机交互和软件自动化。

排序理由 研究型实体发布具有新颖训练技术的新模型。 [lever_c_demoted from research: ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

inclusionAI 发布 Vista 9B/4B GUI 基础模型

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/jacek2023 ·

    inclusionAI 推出 Vista 9B/4B

    <!-- SC_OFF --><div class="md"><h1><a href="https://huggingface.co/inclusionAI/VISTA-9B#vista-9b"></a>VISTA-9B</h1> <p>VISTA-9B are GUI-grounding vision-language models trained from Qwen3.5 9B backbones with <strong>VISTA: View-Consistent Self-Verified Training for GUI Grounding<…