研究人员开发了P4IR,一个新颖的两阶段框架,旨在提高大型语言模型(LLM)在生成建筑法规自动化代码合规性(ACC)系统方面的准确性。该框架首先采用监督微调(SFT)为LLM注入领域特定知识,然后采用组相对策略优化(GRPO)来优化生成的代码骨架。与仅SFT的基线相比,该方法显示出显著的改进,将树编辑距离减少了高达23.8%,将令牌级Levenshtein距离减少了38.6%,同时还显示出假阳性率的降低。 AI
影响 这项研究提供了一种提高LLM生成的代码合规性系统的可靠性和准确性的方法,有可能减少自动化法规检查中的错误。
排序理由 该集群包含一篇研究论文,详细介绍了一个用于提高LLM在特定任务上性能的新框架。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →