PulseAugur
实时 13:30:36
English(EN) Surpassing Scale by Efficiency: A Compact 135M Parameter Foundational LLM Natively Adapted for the Bangla Language

紧凑型孟加拉语大语言模型以高效设计超越大型模型

研究人员开发了一种新的紧凑型语言模型 bangla-smollm-135m,专门为孟加拉语设计。该模型拥有 1.35 亿个参数,通过采用高效的 token 合并策略,在性能上可与更大的模型相媲美。在零样本评估中,它在各种基准测试中达到了与其两倍大小模型相当或更优的性能,并与 10 亿参数模型表现相当。 AI

影响 证明了高效的小型模型可以实现具有竞争力的性能,有可能在资源受限的环境中更广泛地部署大语言模型。

排序理由 该集群描述了一篇在 arXiv 上发表的关于新语言模型的论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Rabindra Nath Nandi ·

    Surpassing Scale by Efficiency: A Compact 135M Parameter Foundational LLM Natively Adapted for the Bangla Language

    arXiv:2606.16383v1 Announce Type: new Abstract: While the NLP landscape is dominated by multi-billion parameter architectures, their deployment in low-resource, non-Latin scripts remains computationally prohibitive for edge configurations, mobile systems, and decentralized local …

  2. arXiv cs.CL TIER_1 English(EN) · Rabindra Nath Nandi ·

    Surpassing Scale by Efficiency: A Compact 135M Parameter Foundational LLM Natively Adapted for the Bangla Language

    While the NLP landscape is dominated by multi-billion parameter architectures, their deployment in low-resource, non-Latin scripts remains computationally prohibitive for edge configurations, mobile systems, and decentralized local hardware. This paper presents bangla-smollm-135m…