AI争霸战开启!OpenAI急建10万块GB200超算,马斯克10万块H100月末开训

AI争霸战开启!OpenAI急建10万块GB200超算,马斯克10万块H100月末开训

文章来源:新智元

【导读】马斯克官宣xAI建造的世界最大超算集群,由10万块H100搭建,预计本月末开始投入训练。另一边,OpenAI再次加码,将打造由10万块GB200组成的超算,完全碾压xAI。


为了抵达AGI,全世界的公司们准备要烧掉所有的GPU!Information独家报道称,OpenAI的下一个超算集群,将由10万块GB200组成。这可用上了英伟达迄今为止最强的AI芯片。

另一边,xAI也在打造号称「世界上最大超算集群」,由100k H100组成,并将在本月末投入训练。在马斯克最新帖子中,针对报道——xAI与甲骨文终止服务器交易谈判,立即做出了回应。他表示,xAI已经向甲骨文购买了24000块H100,并在这些芯片上训练的Grok 2。

Grok 2目前正在进行微调、错误修复,预计下个月准备就绪发布。与此同时,xAI也在自行建设10万块H100搭建的集群,目标是实现最快的训练完成时间,计划本月晚些时候开始训模型。这将成为世界上最强的训练集群,优势不言而喻。我们决定自行建设10万块H100芯片系统,以及下一代主要系统的原因是,我们的核心竞争力取决于能否比其他AI公司更快。这是赶上竞争对手的唯一途径。甲骨文是一家优秀的公司,还有另一家公司(暗指微软)在参与OpenAI的GB200集群项目中也表现出很大潜力。但是,当我们的命运取决于成为速度最快的公司时,我们必须亲自掌控,而不能只做一个旁观者。

简言之,在这个日新月异的时代下,想要超越竞争对手,必须确保有绝对的速度优势。

xAI甲骨文谈崩,百亿美元打水漂

今年5月,Information曾报道,xAI一直在讨论一项多年协议,即从甲骨文租用英伟达AI芯片。这笔交易预计高达100亿美元,却因一些问题陷入僵局。其中就包括,马斯克要求超算建造的速度,完全超越了甲骨文勺想象。还有甲骨文勺担心xAI首选地点没有足够的电力供应。为了改变这一现状,只能依靠自力更生了。现在,xAI在田纳西州孟菲斯市,正建起自己的AI数据中心,其中用到了Dell和Supermicro出货的英伟达芯片。根据参与谈判的人士透露,甲骨文并没有参与这个项目。其实,在此之前,xAI已经从甲骨文租用了许多英伟达芯片,成为这家云计算GPU供应商最大的客户之一。尽管更广泛的谈判失败,但这项协议目前仍将继续。从马斯克最新回应中,可以看出,甲骨文芯片数量已经从5月份的16000块增长到了24000块。

10万块H100串联

不过,马斯克依旧希望建造一台配备10万块英伟达GPU的超级计算机,将其称为「Gigafactory of Compute」。他表示,xAI需要更多的芯片,来训练下一代AI模型——Grok 3.0。老马在5月曾向投资者表示,希望在2025年秋季之前让这…



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

AI争霸战开启!OpenAI急建10万块GB200超算,马斯克10万块H100月末开训

https://www.gptnb.com/2024/07/18/2024-07-17-auto4-tOPGf6/

作者

ByteAILab

发布于

2024-07-18

更新于

2025-03-21

许可协议