实体 LLaVA-onevision

LLaVA-onevision

PulseAugur coverage of LLaVA-onevision — every cluster mentioning LLaVA-onevision across labs, papers, and developer communities, ranked by signal.

总计 · 30天

2

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

2

90 天内 2

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

RESEARCH · CL_107765 · Jun 23 · 12:13

新方法通过高效内存和重看能力增强流媒体视频理解 · 跟踪 6 个来源

研究人员开发了新方法，在严格的计算和内存限制下提高流媒体视频理解 (SVU) 能力。ProtoKV 是一种新颖的内存系统，将旧视频内容聚合为摘要状态，在延迟查询场景下准确率提高高达 12.5 个百分点。另外，video-SALMONN-R$^3$ 使用重看机制来定位相关片段，以实现更高效的问题解答，在计算成本较低的情况下优于基础模型。CausalMem 提供了一种无需训练的方法来构建动态、固定预算的内存库，在 LLaVA-OneVis…
RESEARCH · CL_50513 · May 25 · 00:00

新研究推进AI模型的向量量化技术

几篇最新的研究论文探讨了AI模型向量量化技术的进展。ArcVQ-VAE引入了球形角度裕度先验，以提高图像建模中的潜在表示多样性和码本利用率。高斯VAE被用于一种无需训练的方法（Gaussian Quant）中，将其转换为VQ-VAE，性能优于现有方法。DiVeQ提供了一种使用重参数化技巧进行向量量化端到端训练的可微分方法，提高了压缩和生成任务的性能。MGVQ通过集成多维敏感度感知和梯度-Hessian融合来实现超低比特量化，专注于压缩…