NeuReality launched Developer Portal for NR1 Inference Platform

整个NR1系统旨在打造更为经济实惠的AI基础架构,实现更快的部署;进一步拓展AI在各个业务领域的应用新领域。图片{ width=50% }


新的软件开发者门户网站和演示介绍了新的方式,让客户可以快速实现NeuReality的软硬件技术的部署。NR1定制专用硅芯片降低了AI的总体拥有成本和能耗,为企业提供发展机会,使其在不断增长的AI转型中保持竞争力。

AIAI Summit—NeuReality,一家AI基础架构技术公司,今天宣布推出了一款新的软件开发者门户网站和演示,方便客户轻松安装其完整的软件堆栈和API。这标志着NeuReality自去年第一季度交付并激活其7纳米AI推理芯片服务器(NR1 NAPU™)以来的重要里程碑,成功推出了整个NR1 AI硬件和软件系统。

NR1™ AI推理解决方案使企业和政府能够运行新的AI训练模型和现有的AI应用程序,无需在稀缺的GPU上投入数百万美元。无论AI加速器的性能如何,CPU始终是AI推理中主要的性能瓶颈,导致过多的能耗和成本,使绝大多数组织今天无法安装和运行最激动人心的AI创新。

自从NAPU于去年12月从台湾台积电交付以来,NeuReality系统于2024年第一季度被认为已准备好迎接客户,随后成功地在短短90天内进行了系统集成。NeuReality首席研发官Ilan Avital表示:“在小型创业团队内完成一个复杂的片上芯片设备和全面硬件/软件AI系统的无缝搭建和集成是一项了不起的成就。”

该系统成功地满足了服务器片上系统(SOC)、IP和软件方面的目标功能和性能要求。这一成就标志着其已准备好进行早期客户试点,特别是与云服务提供商、金融服务和医疗保健领域就计算机视觉、自动语音识别和自然语言处理进行合作,为生成式AI、多模态等更先进的技术奠定了经济实惠的基础。NeuReality将NR1系统的快速搭建过程归功于在2023年合作与Synopsys之前进行的强大架构和严格的仿真测试。

配套的软件开发工具包(SDK)专为企业数据中心中的高容量、高种类AI工作负载设计。它包含了所有类型计算引擎和XPUs的分层工具,以及优化的分区功能,使部署AI推理变得更加容易,管理和扩展,同时也使开发者从传统的部署AI推理的复杂性中获得更多时间。

NeuReality的解决方案提供了前所未有的开发者体验,显著灵活性,使开发者能够更轻松地部署最先进和复杂的AI管线,基于其项目的特定需求。它为开发者提供了用于完整AI管线加速、编排、配置和推理运行时API的工具链,以简化AI部署工作流程。所有这些内容以及更多内容现在都在一份新的技术白皮书中得到了记录,以激励创新者紧急关注端到端数据中心效率和资源优化,以实现经济实惠的AI部署。

NeuReality提到,全球AI采用率为35%,美国低于25%,他们专注于降低进入主流行业的市场壁垒。Avital补充说:“对于大多数企业来说,这简直是不可及的。”“我们可以通过在源头降低高能耗来开始改变这一点,并教育客户,即理想的AI推理服务器需要与用于AI训练的大型超级计算机和高端GPU完全不同、更高效的服务器配置。”

例如,NeuReality的NR1-S™ AI推理设备在性能上优于Nvidia DGX H100系统,性能相同,但数据处理性能提高了6倍,价格减半,能耗仅为三分之一,占用的物理空间减半,而且不需要在系统中安装主机CPU。NR1工程包括将6.5倍的处理能力打包到NR1 NAPU中,相当于在单个4u机箱中承载830个CPU内核,同时具有足够的能力来承载10个Nvidia GPU或任何AI加速器。

“在Cleveland Avenue,我们看到颠覆性AI技术如NeuReality对零售场景实现革命的巨大潜力,特别是在我们专注于餐馆、食品科技和饮料投资领域,”Cleveland Avenue技术投资管理合伙人Mingu Lee表示。

“通过运行大规模AI模型,例如为零售分析提供计算机视觉、为店内和在线虚拟助手提供对话AI和个性化推荐,以及生成式AI驱动的汽车驶入通道,我们不仅在投资技术,还在投资于使‘无权利的企业’能够利用AI提供出色的客户体验和高效的业务流程,确保即使利润微薄的企业也可以借助AI实现卓越。”Lee补充道。

访问新的软件开发者门户网站,了解更多信息:developer.neureality.ai。




感谢阅读!如果您对AI的最新发展感兴趣,可以查看更多AI文钊文章:GPTNB

感谢阅读!如果您对AI的最新发展感兴趣,可以查看更多AI文钊文章:GPTNB

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

NeuReality launched Developer Portal for NR1 Inference Platform

https://www.gptnb.com/2024/04/18/2024-04-18-auto3-fqUCuk/

作者

ByteAILib

发布于

2024-04-18

更新于

2025-03-21

许可协议