PulseAugur
实时 15:12:34
English(EN) PAT-VCM: Plug-and-Play Auxiliary Tokens for Video Coding for Machines

新框架为多样化的机器学习任务实现自适应视频编码

研究人员推出了PAT-VCM,一个旨在通过将压缩表示与特定下游任务分离来改进机器视频编码的新框架。这种即插即用的方法使用共享的基线压缩流,并辅以轻量级的、任务感知的辅助令牌。这使得分割、深度估计和语义识别等不同任务能够访问必要的信息,而无需为每个应用程序对编解码器进行完全重新训练。该框架包含视觉残差令牌、提示/控制令牌和语义令牌,以提高性能和可扩展性。 AI

影响 通过实现跨多个下游任务的共享压缩表示,增强了机器视觉模型的适应性和可扩展性。

排序理由 这是一篇详细介绍机器视频编码新框架的研究论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新框架为多样化的机器学习任务实现自适应视频编码

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Wei Jiang, Wei Wang ·

    PAT-VCM: Plug-and-Play Auxiliary Tokens for Video Coding for Machines

    arXiv:2604.13294v2 Announce Type: replace Abstract: Existing video coding for machines is often trained for a specific downstream task and model. As a result, the compressed representation becomes tightly coupled to the end task, making it difficult to scale across multiple tasks…