阿里巴巴的 Qwen 团队发布了 Qwen 1.5,这是一套更新的大型语言模型。这些模型的大小从 5 亿到 720 亿参数不等,提供基础版和聊天优化版。Qwen 1.5 模型在 MMLU 和 GSM8K 等各种基准测试中表现强劲,并以开源许可证发布。 AI
排序理由 一家主要科技公司发布开源 LLM 套件,并附有基准测试结果,属于研究类别。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →
阿里巴巴的 Qwen 团队发布了 Qwen 1.5,这是一套更新的大型语言模型。这些模型的大小从 5 亿到 720 亿参数不等,提供基础版和聊天优化版。Qwen 1.5 模型在 MMLU 和 GSM8K 等各种基准测试中表现强劲,并以开源许可证发布。 AI
排序理由 一家主要科技公司发布开源 LLM 套件,并附有基准测试结果,属于研究类别。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →
**Chinese AI models Yi, Deepseek, and Qwen** are gaining attention for strong performance, with **Qwen 1.5** offering up to **32k token context** and compatibility with Hugging Face transformers and quantized models. The **TheBloke Discord** discussed topics like quantization of …