English(EN) Translate-R1: Cost-Aware Translation Tool Use via Reinforcement Learning

LLM智能体通过技能重写和翻译策略优化成本

作者 PulseAugur 编辑部 · [6 个来源] · 2026-06-05 02:21

研究人员正在探索大型语言模型智能体的成本感知策略，以提高效率和性能。一篇论文介绍了一个技能重写框架，该框架通过保留关键操作锚点来优化成本，从而降低了智能体成本。另一项研究侧重于成本感知的翻译工具使用，开发了一种强化学习策略，该策略能够智能地决定何时翻译输入，以利用LLM的能力而不产生不必要的费用，特别有利于低资源语言。第三篇论文提出了一个用于机器翻译源重写的强化学习框架，该框架直接优化下游翻译质量，性能优于基于提示的方法。 AI

影响这些研究论文提出了提高LLM智能体和翻译系统效率和有效性的新方法，有望带来更强大、更具成本效益的AI应用。

排序理由该集群包含多篇学术论文，详细介绍了AI领域的创新研究方法和发现，特别关注LLM智能体和机器翻译。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 6 个来源。我们如何撰写摘要 →

报道来源 [6]

arXiv cs.CL TIER_1 English(EN) · Qinghua Xing, Yinda Chen, Yaping Jin, Zhenhe Wu, Bohan Lin, Hang Zhou, Xinghao Chen, Hanting Chen, Zhiwei Xiong · 2026-06-10 04:00

What Should a Skill Remember? Quality--Cost Trade-offs in Cost-Aware Skill Rewriting for Language Model Agents

arXiv:2606.09421v2 Announce Type: replace Abstract: Large language model agents increasingly rely on skills: reusable procedural documents encoding workflows, tool use, implementation patterns, validation checks, and domain rules. Skill rewriting is often treated as prompt compre…
arXiv cs.AI TIER_1 English(EN) · Boxuan Lyu, Haiyue Song, Zhi Qu, Hidetaka Kamigaito, Kotaro Funakoshi, Manabu Okumura · 2026-06-09 04:00

改写以翻译，翻译以奖励：用于机器翻译源改写的强化学习

arXiv:2606.08011v1 Announce Type: cross Abstract: Although directly prompting off-the-shelf Large Language Models (LLMs) to generate meaning-preserving source rewrites can effectively enhance Machine Translation (MT) quality, doing so requires manually tuning prompts for differen…
arXiv cs.CL TIER_1 English(EN) · Zhiwei Xiong · 2026-06-08 12:36

技能应如何记忆？面向成本感知技能重写的语言模型代理中的质量-成本权衡

Large language model agents increasingly rely on skills: reusable procedural documents encoding workflows, tool use, implementation patterns, validation checks, and domain rules. Skill rewriting is often treated as prompt compression, but shorter skills can make agents more expen…
arXiv cs.CL TIER_1 English(EN) · Pratik Jayarao, Chaitanya Dwivedi, Himanshu Gupta, Neeraj Varshney, Adithya M Devraj, Meet Vadera, Priyanka Nigam, Bing Yin · 2026-06-08 04:00

Translate-R1：通过强化学习实现成本感知翻译工具使用

arXiv:2606.06835v1 Announce Type: new Abstract: The performance gap across languages in LLMs is well documented, and closing it natively requires pretraining or fine-tuning on corpora that, for most languages, do not exist. Translation offers an alternative: converting an input i…
arXiv cs.CL TIER_1 English(EN) · Manabu Okumura · 2026-06-06 07:00

重写以翻译，翻译以奖励：用于机器翻译源重写的强化学习

Although directly prompting off-the-shelf Large Language Models (LLMs) to generate meaning-preserving source rewrites can effectively enhance Machine Translation (MT) quality, doing so requires manually tuning prompts for different MT models. In this work, we propose RLSR (Reinfo…
arXiv cs.CL TIER_1 English(EN) · Bing Yin · 2026-06-05 02:21

Translate-R1：通过强化学习实现成本感知翻译工具使用

The performance gap across languages in LLMs is well documented, and closing it natively requires pretraining or fine-tuning on corpora that, for most languages, do not exist. Translation offers an alternative: converting an input into the model's dominant language unlocks its fu…

报道来源 [6]

What Should a Skill Remember? Quality--Cost Trade-offs in Cost-Aware Skill Rewriting for Language Model Agents

改写以翻译，翻译以奖励：用于机器翻译源改写的强化学习

技能应如何记忆？面向成本感知技能重写的语言模型代理中的质量-成本权衡

Translate-R1：通过强化学习实现成本感知翻译工具使用

重写以翻译，翻译以奖励：用于机器翻译源重写的强化学习

Translate-R1：通过强化学习实现成本感知翻译工具使用

相关实体

相关话题