Stability.ai/稳定语言模型Zephyr 3B发布：轻量级大语言模型带来全新体验

资讯1年前 (2023)更新花花

3,079 0 0

日期：2023年12月7日

亮点概述：

小而强大： 今日，StableLM Zephyr 3B发布，这是一款拥有30亿参数的语言模型，比之前的7B模型小了60%。这一轻量设计使其能够在各类设备上高效运行，无需庞大的硬件支持。
独特培训方法： 该模型的开发聚焦于创建一个在文本生成领域表现卓越、并符合人类偏好的模型。通过在多个指令数据集上进行监督微调，包括UltraChat、MetaMathQA、Evol Wizard Dataset和Capybara Dataset，模型进一步利用UltraFeedback数据集，采用直接偏好优化（DPO）算法进行调整。UltraFeedback数据集来自OpenBMB研究小组，包含64,000个提示及相应的模型响应。与其他大型模型不同，Stable Zephyr是参数仅为30亿的高效模型之一。

StableLM Zephyr 3B地址：https://huggingface.co/stabilityai/stablelm-zephyr-3b

StableLM Zephyr 7B地址：https://huggingface.co/HuggingFaceH4/zephyr-7b-beta

性能评估：

在MT Bench和AlpacaEval等平台上进行的基准测试中，StableLM Zephyr 3B表现出色，显示出其在生成上下文相关、通顺且语言准确的文本方面的卓越能力。在测试中，它与其他一些更大的模型（如Falcon-4b-Instruct、WizardLM-13B-v1、Llama-2-70b-chat和Claude-V1）相媲美。

MT-Bench得分用于使用LLMs评估模型在开放性问题上的性能，AlpacaEval则专注于模型遵循一般用户指令的能力。

更多关于测试、数据集和安全性的详细信息，请参阅模型卡片。总体来说，性能测试显示，StableLM Zephyr 3B能够超越其他类似用途的更大型模型，突显了这一新型模型的威力和高效性。

多用途应用：

StableLM Zephyr 3B是一款小巧而强大的模型，能够高效而准确地执行各种语言任务，包括指令追踪和问答。该模型非常灵活，适用于多种应用场景，包括创意内容生成（文案创作、摘要）等，同时还能协助教学设计和内容个性化。此外，它能够根据输入数据提供深入见解，并且保持了高效的30亿参数大小，比7B模型小了60%，使其适用于没有高端系统计算能力的设备。

扫描以下二维码加群

告诉管理员您遇到的问题

我们会第一时间为您挑选优质教程和帮您解决问题