研究人员开发了一个新框架,用于评估大型语言模型(LLM)在心理咨询环境中的应用。目前的基准测试通常使用很快就会变得顺从的模拟客户,这给人一种虚假的治疗进展印象。提出的基于认知行为疗法(CBT)的方法引入了CARS,一个使用认知概念图(CCDs)模拟动态阻抗的客户模拟器,以及STREAMS,一个通过强化学习优化的用于战略推理和响应生成的双模块框架。还引入了一个熵加权指标EWTS-MI,用于评估在挑战性互动中的响应能力。 AI
影响 通过模拟真实的客户阻抗,提高了LLM在咨询等敏感领域的评估能力。
排序理由 该集群包含一篇学术论文,详细介绍了在特定领域评估LLM的新框架和方法。
在 Hugging Face Daily Papers 阅读 →
- CARS
- Cognitive Conceptualization Diagrams
- Large Language Models
- Cognitive Behavioral Therapy
- EWTS-MI
- STREAMS
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →