研究人员开发了 ProCUA-SFT,一个旨在改进与图形桌面环境交互的计算机使用代理(CUAs)训练的新数据集。AgentNet 等现有数据集已显示出负迁移效应,阻碍了性能。ProCUA-SFT 由 310 万个来自合成轨迹的步级样本组成,通过使用自动化的任务生成和验证管道来解决这个问题。在 ProCUA-SFT 上微调 UI-TARS 7B 模型,在 OSWorld 基准测试上显著提高了性能,优于在 AgentNet 上训练的模型。ProCUA-SFT 的一部分也被整合到 Nemotron 3 Nano Omni 模型中,以增强其计算机使用能力。 AI
影响 这个新数据集显著提高了 AI 代理与桌面环境交互的能力,有可能加速开发更强大、更自主的软件代理。
排序理由 该集群描述了一个新的数据集和技术报告,详细介绍了其创建和为 AI 代理带来的性能改进,这属于研究范畴。
在 Hugging Face Daily Papers 阅读 →
- AgentNet
- Kimi K2.5
- Nemotron 3 Nano Omni
- OSWorld
- ProCUA-SFT
- SpreadsheetBench
- UI-TARS 7B
- Zenodo10K
- arXiv
- Hugging Face
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →