English(EN) FeedEval: Pedagogically Aligned Evaluation of LLM-Generated Essay Feedback

新框架评估大语言模型生成的论文反馈的教学质量

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-17 04:00

研究人员开发了FeedEval，一个旨在评估大语言模型（LLMs）为论文生成的反馈质量的新框架。该系统基于特异性、有用性和有效性等教学原则来评估反馈，并使用专门的大语言模型评估器。在ASAP++基准上的实验表明，FeedEval的评估与人类专家的判断非常接近，并且使用FeedEval过滤后的反馈可以提高论文评分模型的性能，并带来更有效的论文修改。 AI

影响提高了LLM生成的反馈在教育环境中的可靠性和有效性，可能改进自动论文评分和学生修改过程。

排序理由该集群包含一篇学术论文，详细介绍了评估LLM生成内容的新框架。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Seongyeub Chu, Jongwoo Kim, Munyong Yi · 2026-06-17 04:00

FeedEval: Pedagogically Aligned Evaluation of LLM-Generated Essay Feedback

arXiv:2601.04574v2 Announce Type: replace Abstract: Going beyond the prediction of numerical scores, recent research in automated essay scoring has increasingly emphasized the generation of high-quality feedback that provides justification and actionable guidance. To mitigate the…

报道来源 [1]

FeedEval: Pedagogically Aligned Evaluation of LLM-Generated Essay Feedback

相关实体

相关话题