PulseAugur
实时 09:26:18
English(EN) Riazi-8B: An Urdu Large Language Model for Mathematical Reasoning

新的乌尔都语大型语言模型 Riazi-8B 增强了数学推理能力

研究人员开发了 Riazi-8B,一个专为乌尔都语数学推理设计的新型大型语言模型。该模型通过两步适应过程创建,包括在乌尔都语维基百科上持续预训练,以及在乌尔都语思维链数据上进行微调。在 MGSM-Urdu 基准测试上的评估表明,Riazi-8B 在答案正确性和推理质量方面优于现有的乌尔都语指令微调模型,展示了一种将先进人工智能能力扩展到低资源语言的有效策略。 AI

影响 将大型语言模型先进的数学推理能力扩展到乌尔都语等低资源语言。

排序理由 该集群描述了一篇关于一种专门用于低资源语言的 LLM 的新研究论文的发布。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新的乌尔都语大型语言模型 Riazi-8B 增强了数学推理能力

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Azher Ali, Ibtsam Haider, Raja Khurram Shahzad, Seemab Latif, Mehwish Fatima ·

    Riazi-8B: An Urdu Large Language Model for Mathematical Reasoning

    arXiv:2606.25568v1 Announce Type: new Abstract: Recent LLMs demonstrate strong mathematical reasoning capabilities, but existing gains rely heavily on English-centric training resources and benchmarks. As a result, reasoning performance degrades substantially in low-resource lang…

  2. arXiv cs.CL TIER_1 English(EN) · Mehwish Fatima ·

    Riazi-8B: An Urdu Large Language Model for Mathematical Reasoning

    Recent LLMs demonstrate strong mathematical reasoning capabilities, but existing gains rely heavily on English-centric training resources and benchmarks. As a result, reasoning performance degrades substantially in low-resource languages such as Urdu, where reasoning-oriented dat…