PulseAugur
实时 11:42:42
English(EN) Automated Essay Scoring and Language Certification: Assessing Generalizability, Agreement and Validity for French

新框架提升自动化论文评分系统评估效果

研究人员开发了一个改进的框架来评估自动化论文评分(AES)系统,超越了极简实践。该新框架纳入了公平性分析、语言特征相关性、错误预测以及与人工评分者的一致性。该框架应用于法语AES,并在大量论文语料库上比较了八种模型架构,展示了其在理解AES模型能力和局限性方面的效用。 AI

影响 为评估人工智能驱动的论文评估工具的可靠性和公平性提供了一种更稳健的方法。

排序理由 该集群包含一篇学术论文,详细介绍了自动化论文评分系统的新评估框架。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Rodrigo Wilkens, R\'emi Cardon, Vincent Folny, Thomas Fran\c{c}ois ·

    Automated Essay Scoring and Language Certification: Assessing Generalizability, Agreement and Validity for French

    arXiv:2606.02009v1 Announce Type: new Abstract: In Automated Essay Scoring (AES), benchmarking practices have fostered minimalist evaluation practices, in contrast with the broader-view recommendations of evaluation frameworks, such as the argument-based validation framework (ABV…