PulseAugur
实时 07:21:48
English(EN) Compiling Deterministic Structure into SLM Harnesses

新的 SGDe 框架为小型语言模型编译工作流

研究人员开发了语义梯度下降(SGDe),一种新颖的师生框架,旨在将复杂代理工作流编译成确定性结构,以用于部署小型语言模型到企业环境中。该方法使用一个前沿 LLM 作为教师来生成批评,这些批评充当梯度,用于优化小型模型的执行计划,包括 DAG 拓扑和系统提示。SGDe 在具有挑战性的数据集上展示了显著的准确性提升,通过利用教师模型作为统计先验并以最少的训练示例实现收敛,从而优于当前的提示优化技术。 AI

影响 这种方法可以通过提高小型 AI 模型的推理能力,从而实现更具成本效益和更安全的企业部署。

排序理由 这是一篇详细介绍编译 AI 工作流新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的 SGDe 框架为小型语言模型编译工作流

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Zan Kai Chong, Hiroyuki Ohsaki, Bryan Ng ·

    Compiling Deterministic Structure into SLM Harnesses

    arXiv:2604.17450v2 Announce Type: replace Abstract: Enterprise SLM deployment faces epistemic asymmetry: small models cannot self-correct reasoning errors, while frontier LLMs incur prohibitive costs and data sovereignty risks at scale. We propose Semantic Gradient Descent (SGDe)…