English(EN) Letting Tutor Personas Speak Up for LLMs: Learning Steering Vectors from Dialogue via Preference Optimization

大语言模型通过对话学习的转向向量采纳导师角色

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-03 04:00

研究人员开发了一种方法，通过学习人类师生对话中的“转向向量”来控制大语言模型（LLMs）的行为。这种方法允许大语言模型在没有明确提示的情况下采用不同的辅导角色，捕捉教学策略和情感支持的变化。转向向量提高了与期望导师回应的语义一致性，并获得了有利的评价，展示了一种使用真实对话数据指导大语言模型行为的可解释方式。 AI

影响通过允许角色定制，使更细致、更具适应性的大语言模型驱动的教育工具成为可能。

排序理由学术论文，详细介绍了一种控制大语言模型行为的新方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Jaewook Lee, Alexander Scarlatos, Simon Woodhead, Andrew Lan · 2026-06-03 04:00

让导师人格为大语言模型发声：通过偏好优化从对话中学习转向向量

arXiv:2602.07639v2 Announce Type: replace Abstract: With the emergence of large language models (LLMs) as a powerful class of generative artificial intelligence (AI), their use in tutoring has become increasingly prominent. Prior works on LLM-based tutoring typically learn a sing…

报道来源 [1]

让导师人格为大语言模型发声：通过偏好优化从对话中学习转向向量

相关实体

相关话题