研究人员开发了一个LLM引导的规划系统,旨在提高对复杂核监管文件的多跳推理能力。该系统将任务构建为一个规划问题,其中LLM代理使用浏览、阅读和搜索等工具导航文档树,并维护一个动态知识图谱。在针对NuScale最终安全分析报告文件的200个问题的基准测试中,该系统达到了81.5%的准确率,显著优于PageIndex、LightRAG、HippoRAG和GraphRAG等其他RAG方法。 AI
影响 通过利用LLM处理复杂的推理任务,这种方法可以提高法律和监管文件分析的效率和准确性。
排序理由 该集群包含一篇研究论文,详细介绍了在特定领域中LLM引导规划的新方法。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →