PulseAugur
实时 17:05:03
实体 Roman Urdu

Roman Urdu

PulseAugur coverage of Roman Urdu — every cluster mentioning Roman Urdu across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_104744 ·

    新方法ROMEVA改进罗马乌尔都语语言模型词汇

    研究人员开发了ROMEVA,一种用于扩展多语言语言模型(如mBERT)词汇量的新方法,以更好地处理拼写不一致的语言,例如罗马乌尔都语。该方法结合了子词初始化和PCA引导的锚定损失,以在词汇扩展过程中稳定嵌入。虽然ROMEVA有效地保留了预训练的嵌入空间,但在下游情感分类任务中,直接在罗马乌尔都语语料库上对模型进行微调可获得更优越的性能,这表明对于形态不一致的语言来说,严格的嵌入保留可能并非总是最优的。