English(EN) Scaling Textual Gradients via Sampling-Based Momentum

新的TSGD-M方法增强了LLM提示优化的可扩展性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

研究人员开发了一种名为“带动量的文本随机梯度下降”（TSGD-M）的新方法，以提高大型语言模型提示优化的可扩展性和稳定性。该技术解决了诸如上下文长度限制和简单增加训练数据带来的收益递减等挑战。TSGD-M通过动量采样和自举小批量验证精度重新加权更新，使其能够在不扩展输入上下文窗口的情况下探索过去表现良好的提示。该方法与现有的提示优化框架集成，并在六个基准测试中显示出一致的改进。 AI

影响通过提高可扩展性和稳定性来增强LLM提示工程，可能导致更有效和高效的模型微调。

排序理由关于LLM提示优化新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Zixin Ding, Junyuan Hong, Zhan Shi, Jiachen T. Wang, Zinan Lin, Li Yin, Meng Liu, Zhangyang Wang, Yuxin Chen · 2026-06-30 04:00

Scaling Textual Gradients via Sampling-Based Momentum

arXiv:2506.00400v4 Announce Type: replace-cross Abstract: LLM-based prompt optimization, which uses LLM-provided ``textual gradients'' (feedback) to refine prompts, has emerged as an effective method for automatic prompt engineering. However, its scalability and stability are unc…

报道来源 [1]

Scaling Textual Gradients via Sampling-Based Momentum

相关实体

相关话题