研究人员开发了一个新的流程,使用大型语言模型(LLMs)作为教育评估的裁判,特别是针对大学入学考试的考题级别评分。该系统将 LLM 的输出与官方课程文件和评分指南相结合,以确保准确性和一致性。该流程识别考题主题、认知需求,并利用教学大纲的工件生成评分标准和评估学生答复,其结果与人类导师相当,且具有更可追溯的理由。 AI
影响 这项研究引入了一种将基于 LLM 的教育评估与官方课程相结合的新颖方法,有望提高自动化评分系统的可靠性和透明度。
排序理由 该集群包含一篇详细介绍新研究方法和流程的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →