PulseAugur
实时 10:07:38
English(EN) Towards Fully Automated Exam Grading: Fairness-Aware Recognition of Handwritten Answers with Foundation Models

基础模型在考试自动评分中达到98.4%的准确率

研究人员开发了一种使用视觉语言基础模型(VLM)进行全自动考试评分的方法。这些模型能够准确识别手写答案,在基准数据集上达到98.4%的准确率,显著优于以往的自动化方法。该研究强调公平性,特别是最小化假阴性,并表明有针对性的提示可以将假阴性率降低到0.58%。这种方法使得纸质考试的自动化评分在规模上变得可行,并且通过自我审查步骤可以捕获大多数评分差异。 AI

影响 自动评分系统可能变得更准确和公平,可能影响教育机构和评估流程。

排序理由 该集群包含一篇详细介绍新研究方法和基准结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Hartwig Grabowski ·

    Towards Fully Automated Exam Grading: Fairness-Aware Recognition of Handwritten Answers with Foundation Models

    arXiv:2606.11477v1 Announce Type: cross Abstract: Correcting handwritten exams by hand is time-consuming and error-prone, particularly for large cohorts, while fully digital exams tend to force a didactic narrowing towards closed question formats. A practical middle ground keeps …