KITTI-360: A Novel Dataset and Benchmarks for Urban Scene Understanding in 2D and 3D
PulseAugur coverage of KITTI-360: A Novel Dataset and Benchmarks for Urban Scene Understanding in 2D and 3D — every cluster mentioning KITTI-360: A Novel Dataset and Benchmarks for Urban Scene Understanding in 2D and 3D across labs, papers, and developer communities, ranked by signal.
5 天有情绪数据
-
AI研究优化自动驾驶分割的摄像头传感器
研究人员开发了一种用于自动驾驶摄像头传感器和AI模型协同设计的方法,重点优化传感器的彩色滤光阵列(CFA)权重。该方法在分割任务中表现出显著的改进,在KITTI-360和ACDC等数据集上将mIoU提高了高达0.023。研究发现,优化CFA权重比点扩散函数或噪声等其他传感器参数更具影响力,并且大于2x2的CFA块是有害的。
-
新的DAPETR方法改进了使用鱼眼相机的3D目标检测
研究人员开发了畸变感知PETR(DAPETR),一种使用标准和鱼眼相机混合进行3D目标检测的新方法。DAPETR解决了鱼眼镜头引起的显著畸变问题,而这种畸变通常会违反现有BEV检测器的假设。该系统引入了学习模块来协调位置编码,并将图像特征与3D嵌入进行协同调制,在转换后的KITTI-360基准测试中表现优于先前的方法。
-
新的融合方法应对三维目标检测挑战
两篇新研究论文提出了使用激光雷达和相机数据进行三维目标检测的先进融合技术。第一篇,几何感知鱼眼-激光雷达融合(GA-HF),通过保持鱼眼几何形状并使用注意力机制纠正特征失真来应对低重叠设置中的挑战。第二篇,CAMF-Det,专注于无人机(UAV)平台,开发了一个闭环感知框架,通过建模和预测遮挡强度来处理由树冠和其他地面物体引起的遮挡。
-
机器人通过校准的基础模型数据提高地图精度
研究人员开发了一种新方法,以提高集成到机器人映射系统中的语义信息的可靠性。该方法校准基础模型声明的每类可靠性,并实施冲突丢弃窗口以拒绝与几何感知数据相矛盾的声明。在KITTI-360和ScanNet数据集上的评估表明,与现有方法相比,地图的准确性和精度有了显著提高。
-
PrITTI模型使用原始元素生成可编辑的3D城市场景
研究人员开发了PrITTI,一种用于生成3D语义城市场景的新型潜在扩散模型。与以往的基于体素的方法不同,PrITTI使用基于原始元素(primitive-based)的表示,从而实现更具可控性和可编辑性的场景生成。这种方法以更低的内存占用和更快的推理速度实现了最先进的质量,支持场景编辑和照片级真实感合成等应用。