实体
NLLB-200
NLLB-200
PulseAugur coverage of NLLB-200 — every cluster mentioning NLLB-200 across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
关系
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新基准和语料库推动古希腊语到现代希腊语的翻译
研究人员开发了一个新的古希腊语到现代希腊语翻译基准和数据集,这项任务以前因缺乏平行数据而受到阻碍。AG-MG平行语料库包含超过132,000个句子对,是通过一个涉及网络抓取、先进对齐技术以及使用Gemini 2.5 Flash进行的大型语言模型错误纠正的新颖流程创建的。实验表明,微调Llama-Krikri-8B和M2M100等模型可显著提高翻译质量,最佳模型的BLEU得分达到13.16。
-
CRAFT method speeds up training data selection for sequence-to-sequence models
Researchers have developed a new method called CRAFT (Clustered Regression for Adaptive Filtering of Training data) to efficiently select high-quality subsets of training data for sequence-to-sequence models. This appro…