Snowflake发布Arctic:最开放、企业级LLM
Snowflake(NYSE:SNOW),数据云公司,今日宣布推出Snowflake Arctic,一款最新的大型语言模型(LLM),独特设计成市场上最开放、企业级的LLM。{ width=60% }
Arctic采用独特的专家混合(MoE)架构,在规模上提供顶级智能与效率。优化用于复杂企业工作负载,超越行业多个基准,包括SQL代码生成、指令跟踪等。此外,Snowflake将以Apache 2.0许可发布Arctic的权重和训练方式,为企业AI技术设定了新的开放标准。Snowflake Arctic LLM是Snowflake Arctic模型系列的一部分,该系列包括Snowflake构建的最佳实用的文本嵌入模型,用于检索使用情况。
“这是Snowflake的一个转折点,我们的AI研究团队正在AI的前沿创新,”Snowflake的首席执行官Sridhar Ramaswamy表示。“通过以真正开放的方式向AI社区提供领先的智能和高效性,我们正在进一步拓展开源AI可以做到的范围。我们与Arctic的研究将显著增强我们交付可靠、高效AI给客户的能力。”
Arctic以真正开放、广泛共享的协作方式开拓了新局面。根据Forrester最近的一份报告,约46%的全球企业AI决策者指出,他们正在利用现有的开源LLM来作为组织AI策略的一部分采用生成式AI。Snowflake作为全球逾9,400家公司和组织的数据基础,正在赋予所有用户利用行业领先的开源LLM的能力,同时为他们提供在工作中使用哪些模型的灵活性和选择。
现在,随着Arctic的推出,Snowflake正在发布一款强大的真正开放模型,附带Apache 2.0许可,允许个人、研究和商业使用。更进一步,Snowflake还提供代码模板,以及灵活的推理和训练选项,使用户可以快速开始使用其首选框架部署和定制Arctic。这些包括与NVIDIA NIM、NVIDIA TensorRT-LLM、vLLM和Hugging Face一起。Arctic可立即用于Snowflake Cortex中的无服务器推理,Snowflake的完全托管服务提供数据云中的机器学习和AI解决方案。它还将在Amazon Web Services(AWS)上可用,与其他模型花园和目录一起使用,这些目录将包括Hugging Face、Lamini、Microsoft Azure、NVIDIA API目录、Perplexity、Together AI等。
Arctic以领先的资源效率提供顶级智能。Snowflake的AI研究团队,包括一支独特的行业领先研究人员和系统工程师组成的团队,在构建Arctic时花费不到三个月的时间,大约花费了类似模型训练成本的1/8。在Amazon弹性计算云(Amazon EC2)P5实例上进行训练,Snowflake正在为最新开放、企业级模型的快速训练设定新基准,最终使用户能够规模化创建成本效率更高的定制模型。
作为这一战略性努力的一部分,Arctic的独特MoE设计改善了训练系统和模型性能,精心设计的数据构成专注于企业需求。Arctic还提供高质量结果,每次激活17个4800亿个参数,以实现行业领先的质量和前所未有的标记效率。在效率突破中,Arctic在推理或训练期间激活的参数数比DBRX少约50%,比Llama 3 70B少约75%。此外,它在编码(HumanEval+、MBPP+)和SQL生成(Spider)方面胜过领先的开源模型,如DBRX、Mixtral-8x7B等,同时在一般语言理解(MMLU)方面提供领先性能。
Snowflake继续为所有用户加速AI创新。在Snowflake Cortex中访问时,Arctic将加速客户在数据云的安全和管理范围内规模化构建生产级AI应用的能力。
除了Arctic LLM,Snowflake Arctic系列模型还包括最近宣布的Arctic embed,一组面向开源社区的最新文本嵌入模型,根据Apache 2.0许可提供。这五个模型可以立即在Hugging Face上使用,并将很快作为Snowflake Cortex embed功能的一部分提供(处于私人预览阶段)。这些嵌入模型经过优化,以在将专有数据集与LLMs结合为检索增强生成或语义搜索服务的一部分时提供领先的检索性能。
Snowflake还优先为客户提供数据基础和最新的AI构建块,使他们能够利用企业数据创建功能强大的AI和机器学习应用。在Snowflake Cortex中访问时,Arctic将加速客户在数据云中构建规模化的生产级AI应用的能力。
此外,Snowflake继续为客户提供数据云中最新且最强大的LLMs,包括最新添加的Reka和Mistral AI模型。此外,Snowflake最近宣布扩大与NVIDIA的合作伙伴关系,继续其AI创新,将全栈NVIDIA加速平台与Snowflake数据云结合在一起,提供安全且强大的基础设施和计算能力组合,以释放AI生产力。Snowflake Ventures最近还对Landing AI、Mistral AI、Reka等进行了投资,以进一步加强Snowflake帮助客户利用LLMs和AI从企业数据中创造价值的承诺。
AI专家对新闻的评论
“Snowflake Arctic注定会为扩展我们的战略合作伙伴关系带来显著成果,为所有人提供AI访问、民主化和创新的机会,”AI21 Labs的联合创始人兼联合首席执行官Yoav Shoham表示。“我们很高兴看到Snowflake帮助企业利用开源模型的力量,就像我们最近发布的基于Mamba的Transformer-SSM模型Jamba一样。Snowflake持续的AI投资是我们选择在数据云上构建的重要因素,我们期待继续为我们的共同客户创造更大的价值。”
“Snowflake和AWS一致认为,生成式AI将改变我们所知的几乎每一个客户体验。”AWS的副总裁Compute和Networking大卫·布朗表示。“通过AWS,Snowflake得以定制其基础架构,加快推出Snowflake Arctic的上市时间。使用Amazon EC2 P5实例与Snowflake的高效训练系统和模型架构共同设计,Snowflake能够迅速开发和交付新的企业级模型给客户。并且计划将Snowflake Arctic提供给AWS,客户将有更多选择,利用强大的AI技术加速他们的转型。”
“随着AI的步伐持续加快,Snowflake通过推出Snowflake Arctic已经巩固了自己作为AI创新者的地位,”Coda的联合创始人兼首席执行官Shishir Mehrotra表示。“我们的创新和设计原则与Snowflake对AI和其他领域的前瞻性看法一致,我们很高兴成为这个通过AI改变日常应用和工作流的旅程的合作伙伴。”
“在过去几个月中,开源AI呈现出一股巨大的潮流,”Hugging Face的首席执行官兼联合创始人Clement Delangue表示。“我们很高兴看到Snowflake通过此次发布不仅以Apache 2.0许可发布模型,还提供了模型训练方式。这为企业构建AI和整个领域开创了空前的透明度和控制。”
“Lamini的愿景是民主化AI,赋予每个人建立自己的超级智能的能力。我们相信企业AI的未来是建立在强大开源模型和开放协作基础上的,”Lamini的联合创始人兼首席执行官Sharon Zhou表示。“Snowflake Arctic对支持该AI未来至关重要。我们很高兴能够调整和定制Arctic以获得高度准确的LLMs,优化控制、安全性,并使其能够抵御动态AI生态系统。”
“社区的贡献对解锁AI创新和为所有人创造价值至关重要,”Landing AI的首席执行官Andrew Ng表示。“Snowflake对Arctic的开源发布是让先进模型可供各方微调、评估和创新的激动人心的一步。”
“通过将Snowflake的新LLM模型Arctic的功能性引入Microsoft Azure AI模型目录,我们将增加企业客户在迅速发展的AI领域中的选择,并为企业AI带来更多丰富的能力,”Microsoft Azure AI平台企业副总裁Eric Boyd表示。“我们与Snowflake的合作是我们致力于推动开放创新、扩展AI成果边界的一个例证。”
“开源AI模型的持续进步、以及它们之间的良好竞争,不仅对Perplexity的成功至关重要,而且对于为所有人民主化生成式AI的未来也很重要,”Perplexity的联合创始人兼首席执行官Aravind Srinivas表示。“我们期待使用Snowflake Arctic进行实验,将其定制为我们的产品,最终为最终用户创造更大的价值。”
“Snowflake和Reka致力于使AI能够被每个用户使用,无论他们的技术专长如何,以更快地推动业务成果,”Reka的联合创始人兼首席执行官Dani Yogatama表示。“随着Snowflake Arctic的推出,Snowflake通过将世界级真正开放的大型语言模型交付给用户更进一步实现了这一愿景。”
“作为开源AI研究、模型和数据集领域的领先组织,我们为见证Snowflake Arctic的推出感到高兴,”Together AI的联合创始人兼首席执行官Vipul Ved Prakash表示。“开源AI领域的进步将惠及整个生态系统,赋予全球开发人员和研究人员部署具有影响力的生成式AI模型的能力。”
了解更多:
注册参加2024年6月3-6日在旧金山举办的Snowflake数据云峰会,获取Snowflake的AI新闻,并参加2024年6月6日的Snowflake开发者日活动,了解这些创新的实际应用。
用户可以直接访问Hugging Face获取Snowflake Arctic,并使用Snowflake的Github存储库获取推理和微调的示例。
有关Snowflake Arctic的更多信息和其他资源,请访问这里。
深入了解Snowflake AI研究团队如何训练Snowflake Arctic,请查看这篇博客。
观看组织如何将生成式AI和LLMs引入其企业数据的视频。
在LinkedIn和Twitter上随时关注Snowflake的最新新闻和公告。
1《生成式AI的现状》,Forrester Research Inc.,2024年1月26日。
2 截至2024年1月31日。
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB。
Snowflake发布Arctic:最开放、企业级LLM