实体
Pager
Pager
PulseAugur coverage of Pager — every cluster mentioning Pager across labs, papers, and developer communities, ranked by signal.
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
3
90 天内 3
层级分布 · 90 天
主题
时间线
- 2026-05-15 research_milestone A new paper introduces PAGER, an AI agent for precise geometric GUI control, and a benchmark dataset PAGE Bench. 来源
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 3 条
-
新的MCPDepth框架增强了全向深度估计
研究人员开发了MCPDepth,一个使用多圆柱全景图立体匹配进行全向深度估计的新框架。该方法通过融合不同视角的深度图来提高精度,并引入了一个圆形注意力模块来处理垂直失真,在室外和真实世界数据集上表现优于现有技术。该方法利用了标准的网络组件,使其适用于嵌入式设备的部署。
-
PaGeR框架改编3D模型以进行360度全景场景重建
研究人员开发了PaGeR框架,该框架能够将最初为透视图像设计的现有3D基础模型改编,以从单个全景图像重建完整的360度场景。这种方法允许对尺度不变深度、度量深度、表面法线和天空掩码进行统一的单通道估计。通过最小化架构更改并混合使用透视和全景数据进行训练,PaGeR保留了底层模型的3D先验,同时实现了360度场景的统一估计,并达到了最先进的性能。
-
PAGER AI 代理掌握精确几何 GUI 控制
研究人员推出 PAGER,这是一种专为图形用户界面中的精确几何控制而设计的新型 AI 代理。与容忍附近像素选择的现有模型不同,PAGER 可处理需要点级精度和几何感知验证的任务。它解决了模型擅长动作类型预测但无法完成任务的重大“语义-执行鸿沟”,在任务成功率方面比通用基线提高了 4.1 倍。