四款早期开源模型——Vicuna-13B、Guanaco-33B、Vicuna-33B 和 WizardLM-70B——曾短暂主导聊天机器人竞技场,表现优于早期的商业产品。Vicuna-13B,训练成本为 300 美元,开创了使用 ChatGPT 对话数据进行微调的先河,并间接促成了聊天机器人竞技场平台的创建。Guanaco-33B 展示了 QLoRA 在消费级硬件上进行高效微调的强大能力,这项技术彻底改变了开源模型开发。WizardLM-70B 由微软开发,引入了 Evol-Instruct 方法来生成复杂的训练数据,尽管其后继者 WizardLM-2 在发布后不久神秘地被撤下了公开访问权限。 AI
影响 这些早期的开源模型开创了高效的训练和数据生成技术,为当今先进的大语言模型铺平了道路。
排序理由 该集群详细介绍了早期开源大模型在聊天机器人竞技场基准测试中取得高排名的历史和技术创新。[lever_c_demoted from research: ic=1 ai=1.0]
- Chatbot Arena
- ChatGPT
- Evol-Instruct
- GPT-4
- Guanaco-33B
- LMSYS
- LLaMA
- Microsoft
- QLoRA
- Vicuna-13B
- Vicuna-33B
- WizardLM-2
- WizardLM-70B
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →