inclusionAI 发布了 Vista 9B 和 Vista 4B,这是专为 GUI 基础设计的新的视觉语言模型。这些模型使用视图一致的 GRPO 方法和自验证的跨视图锚定进行训练,并基于 Qwen3.5 主干。这些模型将自然语言指令和屏幕截图映射到标准化框架内的点击坐标,从而实现对图形用户界面的精确交互。 AI
影响 这些模型推进了 GUI 基础能力,可能改善人机交互和软件自动化。
排序理由 研究型实体发布具有新颖训练技术的新模型。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →