PulseAugur
实时 09:44:48
实体 M2M100

M2M100

PulseAugur coverage of M2M100 — every cluster mentioning M2M100 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. RESEARCH · CL_38289 ·

    新基准和语料库推动古希腊语到现代希腊语的翻译

    研究人员开发了一个新的古希腊语到现代希腊语翻译基准和数据集,这项任务以前因缺乏平行数据而受到阻碍。AG-MG平行语料库包含超过132,000个句子对,是通过一个涉及网络抓取、先进对齐技术以及使用Gemini 2.5 Flash进行的大型语言模型错误纠正的新颖流程创建的。实验表明,微调Llama-Krikri-8B和M2M100等模型可显著提高翻译质量,最佳模型的BLEU得分达到13.16。

  2. TOOL · CL_15949 ·

    新模型通过纠正书写异常来改进 Hausa 自然语言处理

    研究人员开发了一种自动纠正 Hausa 文本中书写异常的方法,例如字符替换和间距错误,这些异常经常阻碍自然语言处理应用。他们创建了一个包含超过 400,000 个噪声-干净 Hausa 句子对的数据集,并对包括 M2M100 和 AfriTeVA 在内的各种基于 Transformer 的模型进行了微调。实验表明,M2M100 等模型取得了最先进的结果,证明纠错显著提高了低资源语言的文本分类和机器翻译等下游任务。