Snowflake推出Arctic:最开放、企业级LLM

Snowflake(NYSE:SNOW),数据云公司,今天宣布推出Snowflake Arctic,这是一款最开放、企业级LLM,采用独特的专家混合(MoE)架构,Arctic在规模上交付了一流的智能效率。图片{ width=60% }


它针对复杂的企业工作负载进行了优化,在SQL代码生成、指令跟踪等方面超越了几个行业基准。此外,Snowflake发布了Arctic的权重,采用Apache 2.0许可证,并公布了培训过程的细节,为企业AI技术设立了新的开放标准。Snowflake Arctic LLM是Snowflake Arctic模型系列的一部分,这是由Snowflake构建的一系列模型,还包括用于检索用例的最佳文本嵌入模型。

“这是Snowflake的一个转折点,我们的人工智能研究团队正在AI的前沿进行创新,”Snowflake首席执行官Sridhar Ramaswamy表示。“通过以真正开放的方式向AI社区交付业界领先的智能和效率,我们正在推动开源AI的边界。我们对Arctic的研究将极大增强我们传递可靠高效的AI能力给客户的能力。”

Arctic以真正开放、广泛可用的协作闯入
根据Forrester最近的一份报告,约46%的全球企业AI决策者表示,他们正在利用现有的开源LLM作为组织AI战略的一部分采用生成式AI。在全球范围内有超过9400家公司和组织使用Snowflake作为数据基础,它使所有用户都能够利用具备行业领先的开源LLM,同时还为他们提供了灵活性和可选择性,可以使用什么模型。

如今,随着Arctic的推出,Snowflake正在推出一款功能强大的真正开放模型,采用Apache 2.0许可证,允许无门槛的个人、研究和商业使用。更进一步,Snowflake还提供了代码模板,以及灵活的推理和训练选项,使用户可以快速开始使用并定制Arctic,使用他们喜欢的框架。这将包括NVIDIA NIM和NVIDIA TensorRT-LLM、vLLM和Hugging Face。用于即时使用,Arctic可在Snowflake Cortex中进行服务器端推理,Snowflake Cortex是Snowflake的完全托管服务,提供数据云中的机器学习和AI解决方案。它还将在Amazon Web Services(AWS)上提供,同时还包括其他模型花园和目录,其中包括Hugging Face、Lamini、Microsoft Azure、NVIDIA API目录、Perplexity、Together AI等。

Arctic以领先的资源效率提供一流的智能
Snowflake的人工智能研究团队,包括行业领先的研究人员和系统工程师,花费的训练成本仅为类似模型的八分之一,用时不到三个月,构建了Arctic。Snowflake采用Amazon Elastic Compute Cloud (Amazon EC2) P5实例进行训练,为构建最先进的开放企业级模型设定了新的基准,最终使用户能够以成本效益的方式在规模上创建自定义模型。

作为这一战略努力的一部分,Arctic的独特MoE设计改进了训练系统和模型性能,通过精心设计的数据构成,聚焦于企业需求。Arctic还提供高质量的结果,在一次激活了4800亿参数中的17个,以实现业界领先的质量和空前的标记效率。在效率突破方面,Arctic在推理或训练中激活的参数数量大约比DBRX少50%,比Llama 3 70B少75%。此外,它在编码(HumanEval+、MBPP+)和SQL生成(Spider)等方面超越了领先的开源模型,同时在一般语言理解(MMLU)方面提供领先性能。

Snowflake继续为所有用户加速AI创新
Snowflake继续为企业提供所需的数据基础和尖端AI构建块,以利用其企业数据创建强大的AI和机器学习应用。在Snowflake Cortex中访问Arctic将加速客户能够在数据云的安全和治理边界内规模化构建生产级AI应用的能力。

除了Arctic LLM外,Snowflake Arctic模型系列还包括最近宣布的Arctic embed,这是一系列最先进的文本嵌入模型,可在Apache 2.0许可证下向开源社区提供。这五个模型可在Hugging Face上立即使用,并将很快作为Snowflake Cortex embed功能的一部分(私人预览)提供。这些嵌入模型经过优化,以在与LLM相结合的检索增强生成或语义搜索服务中提供领先的检索性能,成本约为可比模型的三分之一。

Snowflake还优先为客户提供数据云中最新和最强大的LLM,包括最近新增的Reka和Mistral AI的模型。此外,Snowflake最近宣布与NVIDIA扩展伙伴关系,继续其人工智能创新,将全套NVIDIA加速平台与Snowflake的数据云结合起来,提供安全和强大的基础设施和计算能力的组合,以释放AI生产力。Snowflake Ventures最近还投资了Landing AI、Mistral AI、Reka等公司,以进一步致力于帮助客户通过LLM和AI从其企业数据中创造价值。

来自AI专家对此新闻的评论
“Snowflake Arctic将推动我们的战略合作伙伴关系取得显著成果,为所有人带来AI访问、民主化和创新。”AI21 Labs联合创始人兼联合首席执行官Yoav Shoham表示。“我们很高兴看到Snowflake帮助企业发挥开源模型的力量,就像我们最近发布的Jamba (第一款基于 Mamba 的 Transformer-SSM 生产级模型)。Snowflake不断增加的AI投资是我们选择在数据云上构建的重要原因,我们期待继续为我们的共同客户创造更大的价值。”

“Snowflake和AWS都相信生成式AI将改变我们所知道的几乎每个客户体验。”AWS计算与网络副总裁David Brown表示。“与AWS合作,Snowflake能够自定义其基础架构,加速将Snowflake Arctic的训练时间缩短。使用Amazon EC2 P5实例与Snowflake高效的训练系统和模型架构共同设计,Snowflake能够快速开发和交付新的企业级模型给客户。并计划在AWS上提供Snowflake Arctic后,客户将更多选择权,利用强大的AI技术加速他们的变革。”

“随着AI的前进步伐加快,Snowflake推出Snowflake Arctic将其确立为AI创新者,”Coda联合创始人兼首席执行官Shishir Mehrotra表示。“我们的创新和设计原则与Snowflake的前瞻性AI思路一致,我们很高兴成为这段通过AI转变日常应用程序和工作流程的旅程的合作伙伴。”

“在过去几个月中,开源AI呈现了一股巨大的浪潮,”Hugging Face首席执行官兼联合创始人Clement Delangue表示。“我们很高兴看到Snowflake做出重大贡献,不仅通过Apache 2.0许可证发布模型,还提供了其培训细节。这为企业构建AI以及整个领域开拓新领域提供了必要的透明度和控制。”

“Lamini的愿景是民主化AI,让每个人都能构建自己的超级智能。我们认为企业AI的未来是在强大的开源模型和开放协作基础上构建,”Lamini联合创始人兼首席执行官Sharon Zhou表示。“Snowflake Arctic对支持AI未来至关重要。我们很高兴为高精度LLM调整和定制Arctic,优化控制、安全性和适应动态AI生态系统的弹性。”

“社区贡献对解锁AI创新、为每个人创造价值至关重要,”Landing AI首席执行官Andrew Ng表示。“Snowflake的Arctic开源发布对于让尖端模型开放给每个人以进行微调、评估和创新是一个激动人心的步骤。”

“通过将Snowflake的新LLM模型 Arctic 引入Microsoft Azure AI模型目录,我们很高兴为不断发展的AI景观增加企业客户选择,”Microsoft Azure AI平台公司副总裁Eric Boyd表示。“我们与Snowflake的合作是我们扩展开放创新且扩大AI可能性边界的承诺的一个例子。”

“在过去几个月里,开源AI模型的持续推进和健康竞争对于 Perplexity 的成功以及为所有人民主化生成式AI的未来至关重要,”Perplexity联合创始人兼首席执行官Aravind Srinivas表示。“我们期待使用Snowflake Arctic进行试验,定制之后为我们的产品,最终为我们的最终用户创造更大的价值。”

“Snowflake和Reka致力于让每个用户获得AI,无论他们的技术专长如何,以更快地推动业务结果,”Reka联合创始人兼首席执行官Dani Yogatama表示。“通过Snowflake Arctic的推出,Snowflake正在实现这一愿景,将一流的真正开放的大语言模型提供给用户。”

“作为开源AI研究、模型和数据集的前沿组织,我们很高兴见证Snowflake Arctic的推出,”Together AI联合创始人兼首席执行官Vipul Ved Prakash表示。“开源AI领域的进步将使整个生态系统受益,并为全球的开发人员和研究人员提供部署具有影响力的生成式AI模型的能力。”

了解更多:
注册参加2024年6月3-6日在旧金山举办的Snowflake数据云峰会,了解Snowflake的AI公告,并查看2024年6月6日的Snowflake Dev Day,以了解这些创新技术的运作方式。用户可以直接转到Hugging Face下载Snowflake Arctic,并在Snowflake的Github仓库中获取推理和微调的配方。在Snowflake Arctic上获取更多信息和其他资源,请点击此处。深入了解Snowflake AI研究团队如何培训Snowflake Arctic,阅读此博客。观看组织如何将生成式AI和LLM带入其企业数据的视频。在LinkedIn和Twitter上及时获取来自Snowflake的最新消息和公告。

  1. 《生成式AI的现状》,Forrester研究公司,2024年1月26日。2 截至2024年1月31日。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Snowflake推出Arctic:最开放、企业级LLM

https://www.gptnb.com/2024/04/25/2024-04-24-auto3-Alt1xE/

作者

ByteAILab

发布于

2024-04-25

更新于

2025-03-21

许可协议