研究人员开发了一种名为CLARITY的新型语言引导框架,用于自动驾驶场景分割中的RGB-Thermal融合。与以往的静态方法不同,该方法根据检测到的场景条件动态调整其融合策略。CLARITY利用视觉-语言模型的先验知识来调节每种模态的贡献,并使用对象嵌入进行分割。它还包括保留有效暗目标语义和强制跨尺度的结构一致性的机制,从而在MFNet数据集上取得了最先进的性能。 AI
排序理由 该集群包含一篇学术论文,详细介绍了用于特定AI任务(场景分割)的新框架及其实验结果。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →