PulseAugur
实时 12:09:24
实体 PACUTE

PACUTE

PulseAugur coverage of PACUTE — every cluster mentioning PACUTE across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_93249 ·

    新的基准 PACUTE 测试 LLM 在菲律宾语中的形态学理解

    研究人员开发了 PACUTE,这是一个由 4,600 个任务组成的新的诊断基准,专门用于评估大型语言模型 (LLM) 在菲律宾语中的形态学理解能力。由于其复杂的形态学,包括插入和重复,标准分词器通常无法捕捉到,这种语言带来了独特的挑战。对开放权重和前沿商业 LLM 的评估显示,虽然前沿模型在识别词素方面表现有所提高,但它们在涉及生成性形态组合和音节划分的任务上仍然遇到困难,这表明这仍然是它们语言能力的一个重大瓶颈。