English(EN) Ensuring Reliability in Programming Knowledge Tracing: A Re-evaluation of Attention-augmented Models and Experimental Protocols

研究发现PKT模型性能提升可能因实验缺陷而夸大

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-07 04:00

一项新研究重新评估了用于编程知识追踪（PKT）的注意力增强模型，发现其报告的性能提升高度依赖于实验设计选择。研究强调了注意力维度设置以及因学生尝试顺序不当而违反时间因果关系的问题。通过实施受控的评估协议，该研究表明复杂的注意力增强模型与标准的深度知识追踪（DKT）模型之间的性能差距显著缩小，这表明增加架构复杂性并不总是能带来更好的结果。 AI

影响为编程知识追踪中可靠且可比较的评估提供了实用指导，可能影响教育AI模型的评估方式。

排序理由这是一篇发表在arXiv上的研究论文，评估了现有模型和实验协议。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Jaewook Kim, Hyeoncheol Kim · 2026-05-07 04:00

Ensuring Reliability in Programming Knowledge Tracing: A Re-evaluation of Attention-augmented Models and Experimental Protocols

arXiv:2605.04727v1 Announce Type: new Abstract: Programming Knowledge Tracing (PKT) has recently advanced through hybrid approaches that integrate attention-based feature modeling for code representation with RNN-based sequential prediction. While these models report strong empir…

报道来源 [1]

Ensuring Reliability in Programming Knowledge Tracing: A Re-evaluation of Attention-augmented Models and Experimental Protocols

相关实体

相关话题