研究人员推出Chronicles-OCR,一个旨在测试视觉大语言模型(VLLMs)对汉字跨时间感知能力的新基准。该基准涵盖了从古代甲骨文到现代书法,中国文字的完整演变轨迹,解决了缺乏捕捉数千年系统性视觉变化的数据集的问题。Chronicles-OCR包含2,800张平衡图像,并提出了一种新颖的标注范式来处理剧烈的形态变化,提供了四项任务来评估VLLMs在历史文本感知方面的局限性。 AI
影响 为VLLMs提供了一个新的评估工具,用于评估其在历史文字上的鲁棒性,可能提高AI在数字人文领域的应用价值。
排序理由 该集群描述了一篇介绍用于评估AI模型的新颖基准的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →