English(EN) I Gave Qwen3.7-Plus a Screenshot and It Found the Exact Pixel to Click for $0.40

Qwen3.7-Plus 模型在复杂的 AWS 控制台截图中精确点击像素

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-08 05:08

一位用户演示了 Qwen3.7-Plus 模型能够准确识别复杂截图中特定的可点击像素。通过提供 AWS 控制台的图像，该模型能够精确找到启动实例所需的像素。这一能力凸显了该模型在复杂界面中进行精确视觉交互和完成任务的潜力。 AI

影响展示了 AI 导航和交互复杂图形用户界面的潜力，有助于自动化和用户辅助。

排序理由展示了现有模型的特定能力，而非新发布或重大的行业事件。

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Towards AI TIER_1 English(EN) · Chew Loong Nian - AI ENGINEER · 2026-06-08 05:08

我给Qwen3.7-Plus一张截图，它找到了点击的精确像素，仅花费0.40美元

<div class="medium-feed-item"><p class="medium-feed-image"><a href="https://pub.towardsai.net/i-gave-qwen3-7-plus-a-screenshot-and-it-found-the-exact-pixel-to-click-for-0-40-efb492e5aafd?source=rss----98111c9905da---4"><img src="https://cdn-images-1.medium.com/max/1536/1*qK2iPpPF…