English(EN) LLM-as-Judge in Education: A Curriculum-Grounded Marking Pipeline

LLM-as-Judge 流程将 AI 评分与官方课程相结合

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-17 04:00

研究人员开发了一个新的流程，使用大型语言模型（LLMs）作为教育评估的裁判，特别是针对大学入学考试的考题级别评分。该系统将 LLM 的输出与官方课程文件和评分指南相结合，以确保准确性和一致性。该流程识别考题主题、认知需求，并利用教学大纲的工件生成评分标准和评估学生答复，其结果与人类导师相当，且具有更可追溯的理由。 AI

影响这项研究引入了一种将基于 LLM 的教育评估与官方课程相结合的新颖方法，有望提高自动化评分系统的可靠性和透明度。

排序理由该集群包含一篇详细介绍新研究方法和流程的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Xiwei Xu, Chen Wang, Jacky Jiang, Phil Yang, Qian Fu, Mohan Dhall, Wenjie Zhang, Liming Zhu · 2026-06-17 04:00

LLM-as-Judge in Education: A Curriculum-Grounded Marking Pipeline

arXiv:2606.17507v1 Announce Type: new Abstract: Generative AI and large language models (LLMs) are increasingly applied to question generation and automated assessment. However, deploying LLMs in preparation for high-stakes exams requires more than prompt engineering; it demands …

报道来源 [1]

LLM-as-Judge in Education: A Curriculum-Grounded Marking Pipeline

相关实体

相关话题