黄仁勋的“老故事”讲不动了吗 新核弹引爆未来
在圣何塞SAP中心,黄仁勋穿着标志性的黑皮衣走上台,开始了长达两小时的演讲。他发布了一系列重要信息。

首先介绍了Vera Rubin平台,该平台由七款突破性芯片、五个机架和一个巨型超级计算机组成。其中Vera CPU效率是传统机架式CPU的两倍,速度提升50%。Vera Rubin系统采用100%液冷设计,使用45°C的温水进行冷却,大幅减轻了数据中心的冷却压力与能源成本,并将安装时间缩短至仅需两小时。这些芯片协同工作,构成一台强大的AI超级计算机,支持AI的各个阶段,从大规模预训练到实时智能推理。

接着,黄仁勋宣布英伟达目前看到了至少1万亿美元的需求订单,覆盖到2027年。他还详细阐述了AI工厂的商业模式——Token的分层定价体系,从免费层到premium层。

黄仁勋还发布了NemoClaw项目,这是一个开源项目,在几周内实现了Linux 30年的成就。他表示每家公司都需要OpenClaw战略。

这场发布会涵盖了芯片、工厂、机器人、AI Agent等众多话题,每个词都可能是下一个万亿市场的入口。

Vera Rubin平台展示了惊人的效能跃进,仅需1/4的GPU即可完成混合专家大模型(MoE)的训练,单Token的生成成本降至十分之一。新一代的NVL72机架通过第六代NVLink连接了72块Rubin GPU与36块Vera CPU。黄仁勋特别指出,第六代NVLink交换系统是极度难以实现的技术,但英伟达成功达成了这项创举。

此外,Vera CPU强势登场,标志着英伟达正式进军CPU直销领域。Vera CPU专为极高的单线程效能、强大的数据处理能力与极致的能源效率而设计。它配备了88个核心与144个线程,采用深度定制化的Arm v9.2-A Olympus核心,指令级平行度提升了1.5倍。Vera CPU通过NVLink-C2C互连技术与GPU配对,提供1.8 TB/s的相干带宽。

英伟达收购了开发Groq芯片的团队,并将其技术与Vera Rubin深度整合。Groq 3 LPU每个芯片集成了500MB的SRAM,带宽高达150 TB/s,远高于HBM的22 TB/s。这种组合显著提升了推理应用的性能,每兆瓦功耗的推理吞吐量最高可提升35倍。

在网络连接与集群扩展方面,英伟达展示了全新一代的Kyber机架,采用垂直插入设计,成功在单一NVLink网域内连接多达144个GPU。同时,英伟达重新设计了整个存储系统:BlueField-4 STX存储机架,优化了大型语言模型和智能AI工作流生成的数据存储和检索。

黄仁勋还发布了NVIDIA Space-1 Vera Rubin模块,标志着英伟达正式推出太空计算服务。该模块上的Rubin GPU可为基于太空的推理提供高达25倍的AI计算能力,为分布式计算中心、高级地理空间智能处理和自主太空操作提供下一代计算能力。
最后,黄仁勋强调了AI工厂的商业模式,Token的分层定价体系直接关系到AI工厂的营收。他建议尽快行动,因为Token成本会下降,吞吐量会上升。英伟达的“垂直整合然后水平开放”策略将带来巨大的性能提升。
整场发布会充满了对未来科技的展望,从一块GPU到一座AI工厂,黄仁勋用十年时间完成了英伟达的进化。

