在2025年3月于圣何塞举行的GTC大会上,英伟达(NVIDIA)首席执行官黄仁勋(Jensen Huang)指出,业界普遍低估了AI推理阶段的计算需求,实际所需算力是之前预估的百倍 :contentReference[oaicite:2]{index=2}。他强调,随着推理模型复杂性的增加,高效的计算资源变得尤为关键。
AI推理需求的激增
黄仁勋在演讲中提到,随着AI模型从生成式AI向具备推理能力的代理型AI(Agentic AI)发展,计算需求呈指数级增长。传统的生成式AI主要关注内容的生成,而代理型AI则需要理解、推理和决策,这对计算资源提出了更高的要求 :contentReference[oaicite:3]{index=3}。
Blackwell Ultra芯片的发布
为应对这一挑战,英伟达推出了新一代Blackwell Ultra(GB300系列)芯片,预计将在2025年下半年上市。该芯片在AI性能上比前代产品提升了1.5倍,内存容量也增加到288GB HBM3e :contentReference[oaicite:4]{index=4}。此外,英伟达还公布了未来的产品路线图,包括2026年发布的Vera Rubin芯片和2027年的Rubin Ultra芯片,性能将进一步提升。
数据中心投资的增长
黄仁勋预测,到2028年,全球数据中心的资本支出将超过1万亿美元,主要驱动力来自AI推理需求的激增 :contentReference[oaicite:5]{index=5}。这意味着,企业需要升级现有的计算基础设施,以满足不断增长的AI工作负载。
结论
随着AI技术的快速发展,推理阶段的计算需求被严重低估。英伟达通过推出新一代高性能芯片,旨在满足这一需求,并引领AI计算的未来。
感谢您的阅读!如果您希望了解更多人工智能领域的精彩资讯,欢迎前往 GPTNB 探索更多相关文章。