PulseAugur
实时 11:22:55
实体 Weimin Bai

Weimin Bai

PulseAugur coverage of Weimin Bai — every cluster mentioning Weimin Bai across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_115752 ·

    视觉-语言模型作为语义和空间评论员增强3D生成

    研究人员推出VLM3D,一个利用大型视觉-语言模型(VLMs)来改进3D生成的新框架。该方法使用VLMs作为评论员,评估生成3D内容的语义准确性和几何一致性。VLM3D可以作为优化管道中的奖励目标,或作为前馈管道在测试时的引导模块,从而增强与文本提示的对齐并纠正空间错误。

  2. RESEARCH · CL_115292 ·

    新的噪声调度和EM算法提升扩散模型性能

    研究人员开发了一种新的扩散模型噪声调度方法,称为类别频率引导(CFRG),以提高生成质量,特别是在类别不平衡数据集中的低频类别。该方法解决了低密度区域导致分数估计不准确以及高频类别主导生成过程的问题。在类别不平衡数据集(如CIFAR-100-LT和ImageNet-LT)上的图像生成、分类和文本到图像任务的实验表明,与现有方法相比有显著改进。另外,另一篇研究论文介绍了EMDiffusion,一种从损坏观测中训练扩散模型的期望最大化算法…