PulseAugur
实时 10:26:40
English(EN) ProCUA-SFT Technical Report

新的 ProCUA-SFT 数据集提升了 AI 代理的桌面性能

研究人员开发了 ProCUA-SFT,一个旨在改进与图形桌面环境交互的计算机使用代理(CUAs)训练的新数据集。AgentNet 等现有数据集已显示出负迁移效应,阻碍了性能。ProCUA-SFT 由 310 万个来自合成轨迹的步级样本组成,通过使用自动化的任务生成和验证管道来解决这个问题。在 ProCUA-SFT 上微调 UI-TARS 7B 模型,在 OSWorld 基准测试上显著提高了性能,优于在 AgentNet 上训练的模型。ProCUA-SFT 的一部分也被整合到 Nemotron 3 Nano Omni 模型中,以增强其计算机使用能力。 AI

影响 这个新数据集显著提高了 AI 代理与桌面环境交互的能力,有可能加速开发更强大、更自主的软件代理。

排序理由 该集群描述了一个新的数据集和技术报告,详细介绍了其创建和为 AI 代理带来的性能改进,这属于研究范畴。

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新的 ProCUA-SFT 数据集提升了 AI 代理的桌面性能

报道来源 [2]

  1. arXiv cs.LG TIER_1 English(EN) · Jaehun Jung, Ximing Lu, Brandon Cui, Muhammad Khalifa, Shaokun Zhang, Hao Zhang, Jin Xu, Amala Sanjay Deshmukh, Karan Sapra, Andrew Tao, Yejin Choi, Jan Kautz, Mingjie Liu, Yi Dong ·

    ProCUA-SFT 技术报告

    arXiv:2606.17321v1 Announce Type: new Abstract: Training computer-use agents (CUAs) -- models that interact with graphical desktops through screenshots and keyboard/mouse actions -- requires large-scale, diverse trajectory data collected in full desktop environments. The largest …

  2. Hugging Face Daily Papers TIER_1 English(EN) ·

    ProCUA-SFT技术报告

    Training computer-use agents using a large-scale synthetic dataset with automated task generation and verification achieves significantly improved performance on desktop interaction benchmarks.