研究人员开发了 Adaptive Tree-of-Retrieval (Adaptive ToR),这是一种用于多意图自然语言理解的新型架构,可同时优化准确性和计算效率。该系统根据查询复杂度动态调整其检索拓扑,将简单查询通过快速单步路径路由,将更复杂的查询通过自适应深度分层分解路由。在 NLU++ 基准测试上的评估表明,与现有方法相比,准确性相对提高了 9.7%,同时延迟降低了 37.6%,LLM 调用减少了 43.0%。该方法旨在实现性能指标与资源消耗之间的帕累托最优平衡。 AI
影响 提高了多意图 NLU 系统的效率,可能降低运营成本和延迟。
排序理由 学术论文,详细介绍了一种具有基准测试结果的新型 NLU 架构。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →