研究人员开发了一个新框架,用于解释自动化评分模型如何为复杂的语言表现(如课堂记录)分配质量评级。该框架结合了模型无关的Shapley值归因和大型语言模型(LLM)生成的解释。在CLASS框架的反馈质量维度上的测试中,Shapley值在解释模型预测方面比LLM生成的理由更可靠和可转移。 AI
影响 为评估教育评估中AI模型解释的忠实度和可转移性提供了一种更稳健的方法。
排序理由 该集群包含一篇学术论文,详细介绍了用于评估LLM理由和SHAP在基于评分标准的评估中的新框架。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →