PulseAugur
实时 14:50:18
实体 RGB color model

RGB color model

PulseAugur coverage of RGB color model — every cluster mentioning RGB color model across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
15
90 天内 15
发布 · 30天
0
90 天内 0
论文 · 30天
13
90 天内 13
层级分布 · 90 天
主题
情绪 · 30 天

4 天有情绪数据

最近 · 第 1/1 页 · 共 15 条
  1. RESEARCH · CL_86559 ·

    Surflo Model Achieves Flexible 3D Surface Reconstruction via Flow Matching

    Researchers have introduced Surflo, a novel 3D surface reconstruction model that processes unposed RGB views into a global latent state. This approach allows for the decoding of oriented 3D surface points through flow m…

  2. TOOL · CL_77268 ·

    AxisGuide 将机器人动作与视觉数据对齐,以实现更好的操作

    研究人员开发了 AxisGuide,这是一种通过将动作坐标系与视觉观测对齐来改进机器人视觉运动操作的新方法。该技术在相机视图中渲染机器人基坐标系轴,为图像空间中的运动提供明确的线索。实验表明,AxisGuide 在模拟和现实世界的任务中都能提高机器人的性能和泛化能力,尤其是在分布变化的情况下。

  3. RESEARCH · CL_66253 ·

    新框架通过多模态视频对齐改进驾驶员分心检测

    研究人员开发了一种新的多模态视频表示对齐框架,以改进用于驾驶员分心检测的自监督学习。该方法通过联合建模不可靠的阳性和阴性来解决来自多个传感器的噪声或故障数据带来的挑战。该方法使用软目标和基于相似度的加权机制来实现原则性的全局多模态对齐,在 Drive&Act 数据集上表现优于现有基线。

  4. RESEARCH · CL_63044 ·

    新的VPR研究表明灰度图足够,并提出新的融合方法

    两篇新研究论文探讨了视觉定位(VPR)技术的进展,VPR是机器人定位和SLAM的关键技术。第一篇论文《One Channel to Rule Them All》提出,灰度图像足以满足VPR的需求,甚至在严重的外观变化下表现优于RGB,在存储和带宽方面具有实际优势。第二篇论文《DisPlace》引入了一个新颖的框架,该框架融合了多个参考描述符,以创建更具判别性和紧凑的位置表示,在各种挑战性条件下均优于现有的多参考基线。

  5. RESEARCH · CL_37944 ·

    机器人使用RGB摄像头进行3D场景映射,改进探索能力

    研究人员开发了一种新的3D场景图生成框架,该框架仅使用RGB摄像头即可运行,无需激光雷达等深度传感器。这种方法允许在各种机器人平台和深度传感器不可行的环境中更灵活地部署。该系统还结合了主动探索策略,机器人能够智能地选择视点来收集信息,与传统方法相比,显著提高了物体检测和场景理解能力。

  6. TOOL · CL_27994 ·

    iPay框架使用多模态AI进行交通支付识别

    研究人员开发了iPay,一个用于识别交通监控视频中支付动作的新框架。该系统利用多模态专家混合架构,结合RGB和骨骼数据流以及双注意力融合机制。额外的空间差分判别器显式地模拟手部到锚点的运动以增强可辨别性。iPay在一个包含500多个从真实车载交通监控收集的支付片段的数据集上实现了83.45%的识别准确率,证明了其适合边缘部署。

  7. RESEARCH · CL_21832 ·

    新的FusionProxy模块为视觉系统添加了实时热感知能力

    研究人员开发了FusionProxy,这是一个新颖的模块,可将热成像与标准RGB视觉系统集成,实现实时感知。这个即插即用组件解决了现有高保真融合方法的延迟问题,使其适用于边缘部署。FusionProxy在静态识别方面表现出改进的性能,并在自动驾驶等动态任务中增强了鲁棒性,可在各种硬件平台上高效运行。

  8. TOOL · CL_20761 ·

    InterFuserDVS 集成事件相机以增强自动驾驶安全性

    研究人员开发了 InterFuserDVS,这是一种用于自动驾驶的增强型传感器融合模型,它将动态视觉传感器(DVS)与传统的 RGB 相机和 LiDAR 集成。这种新颖的方法在 Transformer 架构内使用基于令牌的融合策略来整合事件数据,事件数据在传统传感器在运动模糊和延迟方面遇到困难的高动态范围和高速场景中表现出色。在 CARLA Leaderboard 上的评估表明,InterFuserDVS 取得了 77.2 的驾驶得分…

  9. TOOL · CL_19359 ·

    SteelSeries Aerox 3 Wireless Gen 2 游戏鼠标设计炫酷但追踪存在缺陷

    SteelSeries Aerox 3 Wireless Gen 2 是一款轻量级游戏鼠标,以其鲜艳的 RGB 灯光和半透明设计而闻名,有三种颜色可选,售价 110 美元。它具有舒适的握持感,令人满意的响亮开关,额定点击次数为 8000 万次,并且尽管采用了蜂窝结构,仍具有 IPX4 防水等级。然而,该鼠标在 2.4GHz 连接时会出现追踪问题,并且其软件需要电子邮件地址。

  10. RESEARCH · CL_18668 ·

    研究人员开发单RGB图像3D人脸重建流程

    研究人员开发了一种从单个RGB图像重建详细3D人脸模型的新流程。该方法利用卷积神经网络和3D可变形模型(3DMM)来克服在生成具有皱纹等精细细节的逼真数据方面的局限性。该流程包括人脸检测、关键点检测、3DMM参数回归和软渲染。

  11. RESEARCH · CL_14099 ·

    REALM框架对齐RGB和事件相机数据以实现跨模态感知

    研究人员开发了REALM,一个新颖的跨模态框架,旨在将RGB和事件相机数据对齐到一个共享的潜在流形中。该方法将事件表示投影到预训练的RGB基础模型的潜在空间中,并利用低秩自适应(LoRA)来弥合模态差距。REALM能够将图像训练的解码器零样本应用于事件流,用于深度估计和语义分割等任务,并在宽基线特征匹配中取得了最先进的成果。

  12. RESEARCH · CL_14102 ·

    MAEPose 使用自监督学习进行雷达视频人体姿态估计

    研究人员开发了 MAEPose,一种使用毫米波雷达视频进行人体姿态估计的新型自监督方法。该方法直接处理频谱图视频,从无标签数据中学习时空表示,与 RGB 方法相比提高了隐私性。MAEPose 表现出显著的性能提升,超越现有基线高达 22.1%,并在有旁观者干扰的情况下仍能保持准确性。

  13. RESEARCH · CL_11339 ·

    OmniRobotHome平台支持实时多方人机交互

    研究人员开发了OmniRobotHome,一个旨在促进真实家庭环境中多方人机交互的新型平台。该系统通过采用48个同步RGB摄像头来感知人类和物体,以应对杂乱空间中的实时3D跟踪挑战,并实现抗遮挡感知。该平台将这种先进的传感能力与两个Franka机器人手臂集成,实现了协调动作和对长时程人类行为建模的研究。初步研究结果表明,实时感知和累积的行为记忆显著提高了安全性以及机器人对人类的预见性辅助能力。

  14. RESEARCH · CL_11395 ·

    新的IRON数据集和IRONet框架推动全天候越野自动驾驶感知能力

    研究人员推出了IRON数据集,这是一个大规模的红外和RGB图像集合,专门用于越野自动驾驶感知,尤其是在夜间条件下。该数据集包含超过24,000张标注图像,并支持用于时间自由空间检测的新算法的开发。为了利用该数据集,研究团队还提出了IRONet,一个使用记忆注意力机制来提高图像帧之间一致性的新颖框架,在IRON数据集上取得了最先进的结果,并展示了对其他数据集的泛化能力。

  15. TOOL · CL_07857 ·

    Google Home 变通方法为智能灯泡恢复 RGB 颜色控制

    据报道,Google Home 正在从某些智能灯泡中移除 RGB 颜色控制功能。此问题阻止用户通过 Google Home 应用调整智能照明的颜色。已找到一种变通方法,允许用户恢复这些颜色控制,确保其智能灯泡保持全部功能。