PulseAugur
实时 09:00:16
实体 Enginuity

Enginuity

PulseAugur coverage of Enginuity — every cluster mentioning Enginuity across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_68566 ·

    新基准测试评估AI处理工程图纸的能力

    研究人员推出了Enginuity,这是一个新的数据集和基准测试,旨在评估视觉-语言模型(VLMs)在复杂工程图纸上的表现。该数据集源自美国军事手册,包含提取零件表和回答关于图纸的视觉问题的任务。对GPT-5.2 Chat和Claude Opus 4.7等领先VLMs的初步评估显示,它们在准确描述零件和在该专业领域内进行事实推理的能力方面存在显著差距。