NeuReality推出NR1推断平台的开发者门户网站

整个NR1系统专为更经济的人工智能基础架构而设计,可实现更快速的部署;进一步扩展人工智能在每个企业中的覆盖范围。图片{ width=50% }


新软件开发者门户网站和演示介绍了客户可以快速实施NeuReality软件至硬件技术的新方法。NR1定制专用硅芯片降低了AI的总拥有成本和功耗,为企业提供了必要的增长机会,以保持在不断增长的人工智能转型中的竞争力。

AIAI峰会—人工智能基础架构技术公司NeuReality今天宣布推出一个新的软件开发者门户网站和演示,可轻松安装其完整的软件堆栈和API。这标志着NeuReality自第一季度交付和激活其7纳米的AI推断芯片NR1 NAPU™以来取得了重要的里程碑,并成功实现了整个NR1 AI硬件和软件系统的启动。

NR1™ AI推断解决方案使企业和政府能够运行新的AI训练模型和现有的AI应用程序,而无需在稀缺的GPU上投资数百万美元。无论AI加速器的性能如何,CPU仍然是AI推断中的主要性能瓶颈,导致过多的功耗和成本,使得大多数组织今天无法安装和运行最令人兴奋的AI创新。

在NAPU于去年12月从台湾的TSMC抵达后,NR1系统在短短90天内成功实现了成功的带起和系统集成,于2024年第一季度被认为是准备投入市场的。“在一个小型初创团队内完成一款复杂的芯片式服务器设备和全面的硬件/软件AI系统的完美集成是一项了不起的成就,” NeuReality的首席研发官Ilan Avital表示。

该系统成功达到了目标功能和性能要求,涵盖了芯片上的服务器(SOC)、知识产权(IP)和软件方面。这一成就标志着它已准备好进行早期客户试点,特别是针对云服务提供商、金融服务和医疗保健领域的计算机视觉、自动语音识别和自然语言处理—为生成式AI、多模态等更先进的技术奠定了一个经济实惠的基础。NeuReality将NR1系统的快速推出归因于在2023年提出前与Synopsys合作进行的强大架构和严格的仿真测试。

附带的软件开发工具包(SDK)专为企业数据中心中的大量、高种类的AI工作负载而设计。它包含了各种类型的计算引擎和XPUs的分层工具,以及优化的划分—使得安装、管理和扩展变得容易,同时使开发人员从传统的部署AI推断的复杂性中节省时间。

NeuReality的解决方案提供了前所未有的开发人员体验,显著增加了部署最先进和复杂AI管线的灵活性,根据项目的具体需求。它为开发人员提供了完整的AI管线加速、编排、分配和推断运行时API的工具链,以简化AI部署工作流程。所有这些内容现在都在一份新的技术白皮书中得到了记录,以激发创新者着手紧急关注端到端数据中心的效率和资源优化,以实现经济实惠的AI部署。

参考全球35%的AI采纳率和美国不到25%的采纳率,NeuReality专注于降低主流行业的市场壁垒。“对于大多数企业来说,这是不可企及的,”Avital补充道。“我们现在可以通过在源头降低高功耗—并教育客户理想的AI推断服务器需要基本不同和更高效的服务器配置,而不是用于AI训练的大型超级计算机和高端GPU。”

例如,NeuReality的NR1-S™ AI推断设备在相同的深度学习处理性能下优于Nvidia DGX H100系统,但提供了6倍的数据处理性能,一半的价格,三分之一的能量消耗,以及一半的物理空间—而且不需要系统中托管CPU。NR1工程涉及将6.5倍的处理能力打包到NR1 NAPU上,相当于在一个4U机箱中承载830个CPU核心,同时有足够的功率托管10个Nvidia GPU或任何AI加速器。

“在Cleveland Avenue,我们看到像NeuReality这样的颠覆性AI技术在零售领域的革新潜力,特别是在我们关注的餐饮、食品技术和饮料投资中,”Cleveland Avenue的技术投资管理合伙人Mingu Lee表示。

“通过NeuReality在运行大规模AI模型方面取得的突破,比如零售分析的计算机视觉、店内和在线虚拟助手的对话AI以及个性化推荐,以及生成式AI驱动的驶过式快餐服务,我们不仅仅是在投资技术;我们正在投资于推广AI,确保即使利润微薄的企业也能借助AI提供出色的客户体验和高效的业务流程,”Lee补充道。

访问新的软件开发者门户网站并了解更多信息:developer.neureality.ai。

探索AITechPark,了解人工智能、物联网、网络安全、AITech新闻以及行业专家的深刻更新!


感谢阅读!如果您对AI的最新发展感兴趣,可以查看更多AI文钊文章:GPTNB

感谢阅读!如果您对AI的最新发展感兴趣,可以查看更多AI文钊文章:GPTNB

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

NeuReality推出NR1推断平台的开发者门户网站

https://www.gptnb.com/2024/04/20/2024-04-19-auto3-dKcNGD/

作者

ByteAILib

发布于

2024-04-20

更新于

2025-03-21

许可协议