PulseAugur
实时 13:27:04
实体 Donut

Donut

PulseAugur coverage of Donut — every cluster mentioning Donut across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. RESEARCH · CL_65613 ·

    研究比较多模态模型用于文档分类

    一篇新研究论文分析了用于分类视觉丰富文档的多模态方法,比较了基于Transformer和LLM的架构。该研究在RVL-CDIP基准上评估了LayoutLMv3、Donut、Qwen3-VL-32B-Instruct和Qwen3-32B。结果表明,专门的多模态Transformer对于具有复杂布局的文档更优越,图像信息是分类最关键的因素。

  2. RESEARCH · CL_04932 ·

    FILTR框架使用Transformer从3D模型中提取拓扑特征

    研究人员开发了FILTR,一个旨在从预训练的3D模型中提取拓扑特征的新型框架。该方法将Transformer解码器应用于生成持久性图(persistence diagrams),这些图直接从冻结的编码器中总结形状的多尺度结构。尽管现有的3D编码器显示出有限的全局拓扑信号,FILTR有效地利用其输出来近似这些图,从而实现从原始点云进行数据驱动的提取。