English(EN) Towards Fully Automated Exam Grading: Fairness-Aware Recognition of Handwritten Answers with Foundation Models

基础模型在考试自动评分中达到98.4%的准确率

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-11 04:00

研究人员开发了一种使用视觉语言基础模型（VLM）进行全自动考试评分的方法。这些模型能够准确识别手写答案，在基准数据集上达到98.4%的准确率，显著优于以往的自动化方法。该研究强调公平性，特别是最小化假阴性，并表明有针对性的提示可以将假阴性率降低到0.58%。这种方法使得纸质考试的自动化评分在规模上变得可行，并且通过自我审查步骤可以捕获大多数评分差异。 AI

影响自动评分系统可能变得更准确和公平，可能影响教育机构和评估流程。

排序理由该集群包含一篇详细介绍新研究方法和基准结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Hartwig Grabowski · 2026-06-11 04:00

Towards Fully Automated Exam Grading: Fairness-Aware Recognition of Handwritten Answers with Foundation Models

arXiv:2606.11477v1 Announce Type: cross Abstract: Correcting handwritten exams by hand is time-consuming and error-prone, particularly for large cohorts, while fully digital exams tend to force a didactic narrowing towards closed question formats. A practical middle ground keeps …

报道来源 [1]

Towards Fully Automated Exam Grading: Fairness-Aware Recognition of Handwritten Answers with Foundation Models

相关实体

相关话题