PulseAugur
实时 12:58:49
English(EN) LLM-as-Judge in Education: A Curriculum-Grounded Marking Pipeline

LLM-as-Judge 流程将 AI 评分与官方课程相结合

研究人员开发了一个新的流程,使用大型语言模型(LLMs)作为教育评估的裁判,特别是针对大学入学考试的考题级别评分。该系统将 LLM 的输出与官方课程文件和评分指南相结合,以确保准确性和一致性。该流程识别考题主题、认知需求,并利用教学大纲的工件生成评分标准和评估学生答复,其结果与人类导师相当,且具有更可追溯的理由。 AI

影响 这项研究引入了一种将基于 LLM 的教育评估与官方课程相结合的新颖方法,有望提高自动化评分系统的可靠性和透明度。

排序理由 该集群包含一篇详细介绍新研究方法和流程的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Xiwei Xu, Chen Wang, Jacky Jiang, Phil Yang, Qian Fu, Mohan Dhall, Wenjie Zhang, Liming Zhu ·

    LLM-as-Judge in Education: A Curriculum-Grounded Marking Pipeline

    arXiv:2606.17507v1 Announce Type: new Abstract: Generative AI and large language models (LLMs) are increasingly applied to question generation and automated assessment. However, deploying LLMs in preparation for high-stakes exams requires more than prompt engineering; it demands …