研究人员开发了DEFINED,一个旨在利用数据高效方法评估辩论场景中创造力的计算框架。该系统采用预训练语言模型和分层评分头来评估创造力的八个维度,区分发散性思维和聚合性思维。该框架在真实的辩论数据上进行了训练,并利用混合粒度策略从有限的专家监督中学习,其表现优于现有的自动评分方法和基于提示的LLM评估器。 AI
影响 该框架为评估复杂、开放式任务中的创造力提供了一种更有效、更准确的方法,有可能减少对昂贵的人工评估的依赖。
排序理由 该集群包含一篇详细介绍评估创造力的新计算框架的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →