PulseAugur
实时 22:27:20
English(EN) From Mirage to Grounding: Towards Reliable Multimodal Circuit-to-Verilog Code Generation

新的 VeriGround 模型实现了可靠的电路到 Verilog 代码生成

研究人员发现,在多模态大语言模型(MLLMs)从电路图生成硬件描述语言(HDL)代码时,存在一个显著的可靠性问题。这种“海市蜃楼”现象发生在模型绕过视觉输入,而是依赖文本标识符来检索预先存在的代码模板时,即使输入图像为空,也能获得高准确率。为了解决这个问题,研究人员开发了一个名为 VeriGround (4B) 的新模型,该模型采用了标识符匿名化和一种新颖的偏好对齐方法(D-ORPO)等技术,以确保真正的视觉基础。VeriGround 展现出具有竞争力的性能,在匿名化输入上优于基线模型,并对无效输入保持高拒绝率。 AI

影响 突出了 MLLMs 在代码生成方面出现的一类新的故障,需要更鲁棒的评估和训练方法。

排序理由 学术论文,介绍了一种新现象和解决该现象的模型。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新的 VeriGround 模型实现了可靠的电路到 Verilog 代码生成

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Guang Yang, Xing Hu, Xiang Chen, Xin Xi ·

    From Mirage to Grounding: Towards Reliable Multimodal Circuit-to-Verilog Code Generation

    arXiv:2604.27969v1 Announce Type: cross Abstract: Multimodal large language models (MLLMs) are increasingly used to translate visual artifacts into code, from UI mockups into HTML to scientific plots into Python scripts. A circuit diagram can be viewed as a visual domain-specific…

  2. arXiv cs.AI TIER_1 English(EN) · Xin Xi ·

    From Mirage to Grounding: Towards Reliable Multimodal Circuit-to-Verilog Code Generation

    Multimodal large language models (MLLMs) are increasingly used to translate visual artifacts into code, from UI mockups into HTML to scientific plots into Python scripts. A circuit diagram can be viewed as a visual domain-specific language for hardware: it encodes timing, topolog…