NVIDIA GTC Keynote 2026

2026-03-17 / 2:25:24 / 约 19 分钟阅读

中中文音频 SOUND ONLY

EN 英文原版 SOUND ONLY

摘要

本次播客内容以黄仁勋在NVIDIA GTC大会上的主题演讲为核心，结合了个人叙事与技术展望。演讲回顾了NVIDIA二十年的发展历程，重点阐述了其如何通过CUDA平台、加速计算和持续创新的软硬件生态，推动人工智能与各行业的深度融合。核心观点在于，计算范式正在发生根本性变革。生成式AI的崛起标志着从传统数据处理向“AI工厂”模式的转变，其中计算的核心产出是“令牌”（Token）。NVIDIA通过其垂直整合但水平开放的策略，构建了从芯片（如最新的Blackwell、Vera Rubin架构）、系统（如DGX Cloud）、库（如cuDNN）到开源框架（如Open CLAW）的全栈能力，旨在成为全球AI基础设施的成本最低、效率最高的选择。关键论据包括：CUDA生态经过20年积累已形成强大的开发者飞轮；RTX技术开启了AI在图形领域的爆炸；生成式AI与代理模型的发展使得AI需具备推理与执行能力，极大提升了算力需求；新架构如Blackwell在特定负载上可实现数十倍的性能提升；而Open CLAW等开源框架将重塑软件公司的构建与运营方式，使其转变为“代币”的生产与消费者。主要结论是，我们正处在一个由AI驱动的新计算时代开端。AI智能体（无论是数字还是物理机器人）将成为普遍存在，各行各业都将经历其“ChatGPT时刻”。NVIDIA通过提供从数据中心到边缘的完整解决方案，并持续每年革新架构，致力于赋能整个生态，共同建设未来。这场变革的规模被形容为“人类史上最大规模的基础设施建设”，其影响将深远而广泛。

详细内容

主题一：战略基石——以CUDA为核心的统一加速计算平台与飞轮效应
主题二：技术融合——从图形处理到AI，再到神经渲染的演进之路
主题三：基础设施重构——打造面向AI时代的加速数据处理与计算平台
主题四：商业模式——“垂直整合、水平开放”的全栈能力与生态协作
主题五：AI技术演进与计算范式变革——从生成、推理到智能体
主题六：硬件架构革新——为智能体AI与AI工厂设计的超级计算系统
主题七：软件与生态革命——Open CLAW操作系统与开源模型计划
主题八：物理AI与机器人的“GPT时刻”——从数字世界走向物理世界
主题九：产业格局重塑——AI原生企业的崛起与投资浪潮
主题十：未来展望——令牌经济、服务分层与持续演进的路线图

主题一：战略基石——以CUDA为核心的统一加速计算平台与飞轮效应

核心观点：英伟达的成功根植于其长达二十年的战略定力，通过构建并持续优化以CUDA为核心的统一加速计算平台，形成了强大的自我强化飞轮效应，这是其所有业务增长的坚实基础。
关键论据：
1. 装机量与生态飞轮：CUDA平台经过二十年发展，已在全球积累数亿个GPU和计算系统装机量，覆盖所有主流云平台和几乎所有行业。庞大的用户基础吸引了全球开发者，他们创造的算法（如深度学习）催生了新市场和新生态系统，进而吸引更多公司加入，进一步扩大用户基础，形成“装机量-开发者-新应用-更多用户”的加速飞轮。
2. 全生命周期软件支持与长期价值：CUDA提供了覆盖AI生命周期各阶段、数据处理和科学计算的广泛软件支持。这使得英伟达GPU一旦部署，便拥有极长的使用寿命和持续降低的长期使用成本。例如，六年前发布的安培架构GPU在云端租赁价格至今仍在上涨。
3. 持续优化与普惠价值：英伟达持续为全球每一块架构兼容的GPU提供软件维护和更新，每次算法或驱动优化都能惠及数百万存量用户，极大地提升了平台的整体价值和客户粘性。
结论：英伟达并非仅仅是一家硬件公司，其核心竞争优势在于通过CUDA构建的、具有强大网络效应和长期价值的软硬件一体化加速计算平台。这个平台的持续繁荣是其应对市场变化、引领技术浪潮的根本保障。

主题二：技术融合——从图形处理到AI，再到神经渲染的演进之路

核心观点：英伟达的技术旅程始于图形处理，并通过持续创新实现了与人工智能的深度融合与相互反哺，展示了跨领域技术融合的巨大潜力。
关键论据：
1. 图形技术奠基AI：二十五年前发明的可编程着色器是世界上首个可编程加速器，为CUDA奠定了基础。GeForce显卡将CUDA带给全球，使得AI研究者发现GPU能极大加速深度学习训练，从而开启了AI大爆炸。
2. AI反哺图形革新：约十年前，英伟达在RTX架构中融合可编程着色和硬件光线追踪，并预见到AI将改变计算机图形学。如今，下一代图形技术“神经渲染”融合了可控的3D图形（结构化数据）与生成式AI，实现了既惊艳又可控的内容生成。
3. 融合模式的普适性：这种将结构化信息（如数据库、知识图谱）与生成式AI相结合的理念，被认为是构建可信、可控AI的基石，并将在医疗、金融、制造等多个行业反复出现。
结论：英伟达成功地将图形处理领域的深厚积累与前沿人工智能技术深度耦合，不仅用图形技术推动了AI的早期发展，现在也用AI技术反过来革新了图形学的未来，证明了其在核心技术栈上持续演进和交叉创新的能力。

主题三：基础设施重构——打造面向AI时代的加速数据处理与计算平台

核心观点：为满足AI时代对海量数据快速处理的需求，英伟达正在与全球生态伙伴合作，重构从数据处理到AI模型训练与推理的整个基础设施，其核心价值主张是加速计算带来的速度、规模与成本的综合优势。
关键论据：
1. 加速数据处理平台：针对传统CPU系统无法满足AI对快速访问海量数据需求的痛点，英伟达创建了加速数据处理平台，包括用于加速结构化数据处理的QDF和用于加速向量存储与非结构化数据处理的QVS。
2. 广泛的生态合作：英伟达与全球IT生态系统深度合作，将加速计算能力植入其中。例如：与IBM合作加速Watson X.Data，帮助雀巢提升5倍数据处理速度并降低成本83%；与戴尔合作创建整合了QDF和QVS的AI数据平台；与谷歌云合作加速Vertex AI和BigQuery，帮助Snapchat降低近80%计算成本。
3. 新计算范式：英伟达强调，加速计算不仅能提升速度和规模，更能显著降低长期运营成本，这是一种用以接替动力不足的摩尔定律的新范式。其与AWS、微软Azure、甲骨文、CoreWeave等云服务商均有深度合作，提供加速计算和机密计算等技术，支持OpenAI、Anthropic等前沿AI模型的部署。
结论：英伟达的战略是成为新一代AI基础设施的赋能者和标准组件提供者，通过广泛的合作伙伴网络，将加速计算渗透到数据处理的每一个环节，从而在底层支撑起整个AI产业的发展。

主题四：商业模式——“垂直整合、水平开放”的全栈能力与生态协作

核心观点：英伟达采用了独特的“垂直整合、水平开放”商业模式，通过深度掌握全栈技术来优化性能，同时通过开放合作融入全球生态来最大化市场覆盖，这是其核心竞争优势。
关键论据：
1. 垂直整合的必要性：英伟达认为，未来的巨大提速和成本降低必须通过应用或特定领域的加速来实现。这要求公司必须深入理解应用场景、领域算法，并掌握从芯片、系统到在各种环境（云、边缘、机器人）中部署的全栈能力。
2. 水平开放的生态策略：在水平层面，英伟达保持开放，努力将其技术和算法库集成到合作伙伴希望的任何平台中。它与云服务商、OEM厂商等协作，共同将加速计算带给全球客户。例如，为谷歌云、AWS、Azure提供加速技术和库，为它们带来客户并落地工作负载。
3. 垂直与水平的协同：垂直整合使英伟达能深度优化和发明关键算法（如cuDNN、CuOpt、CuLitho），解决行业核心问题。水平开放则使其技术能通过庞大的生态系统触达全球每一个角落，实现技术的规模化应用。
结论：这种模式使英伟达既能像苹果一样通过软硬件深度集成实现极致性能，又能像英特尔或微软一样通过广泛的合作伙伴联盟统治市场。它既保证了技术的领先性和优化深度，又确保了市场的广度和适应性。

主题五：AI技术演进与计算范式变革——从生成、推理到智能体

核心观点：AI技术正经历从生成到推理，再到智能体的快速演进，每一次演进都带来能力的质变和计算需求的指数级增长，并彻底改变了计算的本质和基础设施的要求。
关键论据：
1. 能力的三级跳：
  - 生成：ChatGPT开启了生成式AI时代，使AI具备理解、感知和创造内容的能力。
  - 推理：推理型AI使AI能够反思、自我思考、规划和分解问题，让生成式AI的输出变得可靠并基于事实。
  - 智能体：智能体AI能够读取文件、编写代码、编译测试、评估迭代，彻底改变软件工程等工作流程，标志着AI演进到能够真正高效自主工作的阶段。
2. 计算需求的爆炸：过去两年，随着AI能力的演进，其工作负载的计算需求和使用量呈现爆炸式增长，形成了一个“更强能力→更多应用→更大需求→更多投资→更强能力”的正向飞轮。
3. 计算范式的根本转变：生成式AI将计算的本质从以检索为基础转向以生成为基础。数据中心正从“处理文件的地方”转变为“生成令牌（token）的AI工厂”。在电力约束下，驱动最大数量的令牌产出（即“每瓦特令牌数”）成为核心竞争力。
结论：AI技术的快速演进不仅创造了新的应用场景，更引发了一场全新的计算平台变革。未来的竞争核心是AI工厂的“令牌生产效率”，这要求从硬件架构到软件系统的全方位重新设计。

主题六：硬件架构革新——为智能体AI与AI工厂设计的超级计算系统

核心观点：为应对智能体AI时代指数级增长的计算需求，并优化AI工厂的令牌生产效率，英伟达正在通过极致的软硬件协同设计，革新其硬件架构，打造端到端优化、专为未来AI工作负载设计的超级计算引擎。
关键论据：
1. 性能的指数级跨越：从2016年的DGX1到最新的Blackwell和Vera Rubin架构，英伟达的计算能力在十年内增长了数千万倍。最新的协同设计架构实现了350倍的令牌生成性能飞跃。
2. Vera Rubin平台：这是一个面向智能体AI的、完全垂直整合的超级计算机系统，包含专为智能体工作流设计的Vera CPU、AI原生存储、共封装光学交换机，以及全新的Grok LPX机柜（大规模片上SRAM和令牌加速器）。采用100%液冷，将制冷能源用于计算。
3. Grok与Vera Rubin的协同：通过聚合推理理念进行任务分工（预填充、注意力计算、前馈网络、令牌生成分别在Grok和Vera Rubin上处理），结合低延迟网络和Dynamo操作系统，实现了35倍的性能提升，达到新的推理性能层级。
4. 规模化生产与部署：Grok LP30芯片已由三星投入生产，Vera Rubin系统采样顺利，微软Azure已测试首个机架。供应链可支持每月生产数千套系统，相当于每月产出数千兆瓦的AI工厂产能。
结论：英伟达的硬件发展已超越单纯的芯片性能提升，进入为特定AI范式（尤其是智能体）和优化目标（令牌成本）进行全系统协同设计的阶段。其最新平台代表了当前AI计算基础设施的最高效能。

主题七：软件与生态革命——Open CLAW操作系统与开源模型计划

核心观点：在智能体时代，Open CLAW作为开源智能体操作系统，其重要性堪比Linux和HTML，正在引发行业革命。同时，英伟达通过开源模型计划推动AI民主化，助力每个行业和国家构建AI能力。
关键论据：
1. Open CLAW的核心地位：Open CLAW是一个智能体系统，能连接大模型，管理资源，访问工具和文件系统，进行任务调度和分解。它的出现意味着每家公司都需要制定自己的智能体系统战略，企业IT将因此复兴，SaaS公司可能转变为“智能体即服务”公司。
2. 企业级与安全方案：鉴于智能体在企业网络中访问敏感信息和执行代码的安全风险，英伟达推出了具备安全性和企业级隐私能力的Open CLAW企业版，以及集成了“开放壳”安全技术栈的参考架构（Nemo Claw）。
3. 开源模型计划：为支持智能体定制，英伟达通过“开放模型计划”提供世界级、持续更新的前沿开源模型，涵盖语言、物理AI、自动驾驶、机器人、数字生物学等多个领域。
4. Nemotron联盟：英伟达宣布成立Nemotron联盟，携手多家公司共同增强Nemotron 4模型，目标是激活全球每个行业的人工智能模型，帮助每个国家构建主权AI能力。
结论：英伟达在软件生态层面正进行双重布局：一方面，通过Open CLAW定义智能体时代的新“操作系统”标准；另一方面，通过开源模型和联盟合作降低AI应用门槛，培育更广阔的生态，巩固其平台核心地位。

主题八：物理AI与机器人的“GPT时刻”——从数字世界走向物理世界

核心观点：物理AI和机器人技术正迎来其“GPT时刻”，从数字世界走向物理世界，而英伟达凭借其全栈解决方案，正在成为这一变革的关键推动者。
关键论据：
1. 全栈解决方案：英伟达长期致力于物理AI，拥有涵盖训练、合成数据生成与仿真、机器人计算机的全栈解决方案及AI模型。
2. 自动驾驶的突破：英伟达认为自动驾驶汽车的“ChatGPT时刻”已经到来。其RoboTaxi平台新增了比亚迪、现代、日产、吉利等合作伙伴，并与优步合作在多个城市部署自动驾驶出租车，将大幅增加未来具备自动驾驶能力的汽车数量。
3. 机器人普及化：众多机器人公司正在与英伟达合作，将实体AI模型集成到仿真系统中，以部署机器人到全球生产线。甚至T-Mobile也在合作计划将信号塔转变为“机器人信号塔”。
4. 开源工具与合成数据：面对真实世界数据不足的挑战，英伟达提供Isaac Lab、Newton物理模拟器、Cosmos世界模型、Groot开放机器人基础模型等开源工具，以生成合成数据、加速训练，弥合物理AI的数据鸿沟。
5. 现场演示：搭载英伟达Alpamayo技术的自动驾驶汽车演示显示，车辆已具备推理能力，能描述行动、解释决策过程并遵循指令，标志着机器人技术普及化的关键转折点。
结论：英伟达正在将其在数字AI领域的优势成功扩展到物理世界。通过仿真、合成数据和全栈工具，它正在加速物理AI（机器人、自动驾驶）的开发与部署，开启一个机器人与智能体广泛融入现实生产生活的新阶段。

主题九：产业格局重塑——AI原生企业的崛起与投资浪潮

核心观点：生成式AI浪潮正在催生大量AI原生企业，它们基于新的计算平台创造价值，获得了创纪录的投资，标志着产业进入新阶段，并将在未来重塑全球产业格局。
关键论据：
1. 创纪录的投资：过去一年，AI行业获得了创纪录的风险投资，且单笔投资规模巨大。这是历史上首次，所有这类AI原生公司都需要海量算力和大量令牌资源来开展业务。
2. 英伟达的生态角色：英伟达的合作伙伴中包含大量此类AI初创公司，为其提供必需的计算基础设施和支持。
3. 新平台与新巨头：当前正处在类似个人电脑、互联网时代的新计算平台变革起点。每次重大的计算平台变革都催生了一批新巨头（如PC时代的微软、英特尔，互联网时代的谷歌、亚马逊）。这次以AI为核心的计算平台变革，也将诞生对世界有深远影响的新一代企业。
结论：AI原生企业的爆发式增长和巨额融资，不仅是技术成熟的标志，更是产业范式转移的信号。英伟达作为底层计算平台的提供者，将从这一波新企业的成长中持续受益，并与它们共同定义AI时代的产业新格局。

主题十：未来展望——令牌经济、服务分层与持续演进的路线图

核心观点：未来，AI服务将围绕“令牌”这一核心商品形成细分的市场层级和差异化的定价策略。英伟达已制定了清晰的技术路线图，并通过Omniverse DSX等工具优化AI工厂的全生命周期效率，以保持领先。
关键论据：
1. 令牌经济与服务分层：随着模型规模和上下文长度增长，市场将出现分层：高吞吐量、低延迟的令牌用于免费或基础服务；中等层级提供更大模型、更快速度；高级层级则提供极高的令牌生成速度，适用于关键任务，支持更高定价。英伟达的新架构在高价值付费层级实现了性能的巨幅提升。
2. 清晰的技术路线图：英伟达制定了年度更新且向后兼容的AI架构路线图：当前为Blackwell/Oberon；下一代Rubin Ultra正在流片，配备LP35芯片和NVFP4计算架构；再下一代为Feynman，将搭载新款GPU、LPU（LP40）、新CPU（ROSA）及Bluefield 5等。在扩展技术上，铜缆（Kyber）和光学（共封装光学）技术将并行发展以满足更大容量需求。
3. AI工厂的全生命周期优化——Omniverse DSX：面对全球建设AI工厂的效率压力，英伟达推出Omniverse DSX平台，通过数字孪生技术虚拟设计、仿真和运营千兆瓦级AI工厂。该平台能连接电网动态调整能耗，在数据中心内部运用Max-Q技术协调电力散热，以最大化令牌吞吐量和能源效率。从虚拟调试到实际运营后的持续优化，DSX旨在缩短建设时间，降低运营成本。
结论：英伟达对未来有着系统的规划：在商业层面，预判并服务于分层的令牌经济市场；在技术层面，通过清晰的硬件路线图和扩展技术保持领先；在实施层面，通过数字孪生工具确保其基础设施解决方案能以最高效的方式在全球部署和运行。这体现了其从芯片公司向全面的AI基础设施与工厂解决方案提供商转型的完整战略。

总结结论

本播客详细阐述了英伟达如何从一个图形处理器公司演进为全球AI计算革命的中心领导者。其成功并非偶然，而是基于一套环环相扣、长期坚持的战略体系：

平台化战略是根基：以CUDA为核心的统一加速计算平台，通过二十年的积累形成了强大的生态飞轮和长期客户价值，构成了公司最深的护城河。
技术融合创新是引擎：从图形处理到AI，再到神经渲染，英伟达展示了在核心技术栈上持续演进、交叉融合并相互反哺的非凡能力，不断开拓新前沿。
全栈能力与开放生态是双翼：独特的“垂直整合、水平开放”商业模式，使其既能通过全栈深度优化实现极致性能，又能通过广泛的全球合作实现最大规模的市场覆盖。
精准把握技术范式转移：深刻理解并引领了AI从生成、推理到智能体的演进趋势，并预见到计算范式向“AI工厂”和“令牌经济”的根本转变，提前进行布局。
系统性硬件革新：为应对智能体AI的挑战，推出如**V

← 返回列表