实体 CADBench

CADBench

PulseAugur coverage of CADBench — every cluster mentioning CADBench across labs, papers, and developer communities, ranked by signal.

总计 · 30天

3

90 天内 3

发布 · 30天

0

90 天内 0

论文 · 30天

3

90 天内 3

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 3 条

RESEARCH · CL_96104 · Jun 17 · 04:00

新数据集旨在推进AI辅助CAD程序生成

研究人员推出了两个旨在推进AI辅助计算机辅助设计（CAD）的新数据集。CADBench提供了一个统一的基准，包含18,000个跨越六个系列、五种输入模态和六个指标的样本，用于评估CAD程序生成的AI系统。FllumaOne是一个代码原生数据集，提供了100,000个包含可执行Python程序和已验证特征历史的样本，支持各种CAD重建任务。这两个数据集都旨在标准化评估并推动可编辑3D重建领域的发展。
RESEARCH · CL_27975 · May 11 · 17:13

新的基准测试评估AI的CAD程序生成能力

发布了两个新的基准测试，CADBench和BenchCAD，用于评估AI从各种输入生成计算机辅助设计（CAD）程序的能力。这些基准测试旨在标准化多模态AI系统在从图像或3D模型重建可编辑CAD程序等任务中的评估。早期评估表明，虽然专用模型在网格到CAD任务上表现更好，但目前的通用视觉语言模型在复杂的几何细节和工业设计参数方面存在困难，这表明它们在工业准备方面存在差距。
RESEARCH · CL_24398 · May 9 · 18:38

AI CAD工具无法完成基本设计任务，新基准揭示

一个新的基准CADBench已被开发出来，用于评估AI CAD代理的能力，结果显示当前工具在基本机械零件设计方面存在困难。对十个AI代理的28项任务测试表明，所有代理在制造和认知能力方面都未能达到人类水平。该基准包括了GPT-5和Claude Opus等主要的AI CAD工具，突显了它们的局限性，并指出了AI辅助设计需要改进的领域。