实体
Belebele
Belebele
PulseAugur coverage of Belebele — every cluster mentioning Belebele across labs, papers, and developer communities, ranked by signal.
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
3
90 天内 3
层级分布 · 90 天
主题
情绪 · 30 天
3 天有情绪数据
最近 · 第 1/1 页 · 共 3 条
-
LangMAP词元化提升多语言模型性能
研究人员推出了一种新颖的语言自适应词元化方法LangMAP,该方法可从单一共享词汇表中生成特定语言的词元化。此方法基于UnigramLM算法,可在从头开始训练多语言语言模型时应用,或在不改变现有词汇表的情况下调整预训练模型。LangMAP在编程语言的形态边界对齐和抽象语法树叶子边界方面有所改进,但在知识相关任务上的益处则不太一致。
-
多语言语码转换提升了四种语言的LLM性能
研究人员探讨了多语言语码转换数据(CSD)对四种语言(英语、日语、韩语和中文)的大型语言模型(LLMs)的影响。他们的实验表明,在句子层面引入多语言CSD能够持续提升多语言理解任务的平均性能,将语码转换的益处扩展到双语场景之外。
-
新研究解决了混合专家模型中的多语言适应问题
两篇新研究论文探讨了混合专家(MoE)模型在多语言任务中的适应性。一篇论文分析了语言专业化如何在持续预训练期间在MoE模型中出现,发现最终层会发展出特定语言的路由,并提出了一种仅更新少量参数的高效适应策略。另一篇论文介绍了RA-MoE,一个用于对齐跨语言路由模式以提高非英语下游任务性能的微调框架,证明了其在标准微调方法上的持续收益。