【AI翻譯/原音呈現】黃仁勳CES 2026登場 演說揭露最新AI前景
Nvidia 创始人兼 CEO Jensen Huang 的 CES 2025 主题演讲
开场与观众互动
- Jensen Huang 欢迎大家来到拉斯维加斯的 CES,表示很高兴见到3000名现场观众和数千名在线观众。
- 他提到计算机行业每10到15年会经历一次重置,新的平台转变将会发生。
平台转变与人工智能的崛起
- 当前正同时发生两个平台转变:从传统计算向人工智能(AI)过渡,以及在 AI 上构建新应用程序。
- 软件开发方式根本改变,从编程软件转为训练软件,使用 GPU 而非 CPU 来运行。
计算行业的现代化
- 整个计算行业正在被重新定义,过去十年的约10万亿美元的投资正在向新的计算方式现代化。
- 每年有数百亿美元风险投资资金流入这一领域,以支持 AI 的现代化和研发预算的转移。
人工智能的发展历程
- 2022 年 ChatGPT 的出现唤醒了世界对人工智能可能性的认识,而后续的模型如 Chad GPT 引入了“测试时间扩展”的概念。
- 大型语言模型不断改进,并且需要大量计算资源来支持其发展。
新兴代理系统与物理 AI
- 2024 年开始涌现出代理系统,这些系统能够推理、查找信息并解决重要问题,例如 NVIDIA 的 Cursor 模型。
- 物理 AI 是理解自然法则的 AI,与物理世界交互并理解其编码信息的重要性日益凸显。
开放模型的进步
- 去年开放模型取得重大进展,如 Deepseek R1,这是第一个推理系统,引发了全球范围内的创新活动。
人工智能的开放模型革命
开放模型的崛起
- 近年来,开放模型在人工智能领域取得了显著进展,尽管仍落后于前沿模型六个月,但每六个月都会有新模型出现,且这些模型越来越智能。
- 下载量激增,初创公司、大型企业、研究人员和学生等各方都希望参与到人工智能革命中,各国也不例外。
人工智能超级计算机的建设
- 几年前开始构建和运营自己的AI超级计算机(DGX云),并非为了进入云业务,而是为自身开发开放模型而服务。
- NVIDIA目前拥有数十亿美元的超级计算机,这些计算机用于开发开放模型,并吸引了全球各行业的关注。
前沿AI技术的发展
- 在多个领域进行前沿AI模型工作,包括数字生物学中的蛋白质合成与生成,以及天气预测等方面的重大突破。
- Neimotron 3等新一代技术正在不断推出,展示出极高的速度和智能回答能力。
开源与信任
- 在自驾车领域,我们不仅开源了训练所用的数据,还开源了所有模型,以确保对这些模型产生信任。
- 提供了一整套名为Nemo库的工具,用于管理AI生命周期,从数据处理到部署,每个环节均为开源。
AI代理的发展与挑战
- NVIDIA致力于成为前沿AI模型构建者,通过完全开放的方法使每个公司、行业和国家都能参与这一革命。
- 我们在多模态文档理解、语音识别及检索等领域处于领先地位,为用户构建AI代理提供支持。
AI推理能力的突破
AI推理的潜力
- AI模型具备强大的推理能力,能够处理前所未见的情况,并将其分解为已知的知识或规则。
- 这种推理能力使得AI应用不再需要在初始阶段就掌握所有知识,而是可以根据具体情况进行问题解决。
多模态与多模型的应用
- 大型语言模型通过强化学习和思维链等技术实现了基本的推理能力,并且这些技术现已开源。
- Arvin's Perplexity公司展示了同时使用多个模型来解决问题的创新方法,这种做法被认为是天才之举。
未来AI应用架构
- AI具有多模态特性,能够理解语音、图像、文本、视频及3D图形等多种形式的信息。
- AI应用程序将采用混合云架构,以便在不同环境中实时处理数据,例如医院或企业场所。
自定义与智能化
- 基于开放模型和工具,用户可以定制自己的AI,使其具备独特技能,这是当前AI创业公司的动力来源。
- 使用智能路由器管理任务,根据提示意图选择最适合该任务的模型,从而提高效率。
实际案例:个人助手构建
- 构建一个个人助手以管理日历、电子邮件和待办事项,同时监控家庭环境。
- 利用Brev将DGX Spark转变为个人云,通过Frontier模型API轻松启动项目。
- 助手通过HuggingFace的Reachi迷你机器人与用户互动,实现对家庭环境的控制。
构建现代AI应用的基础框架
AI应用的基本框架
- 现代AI应用的构建方式已经变得极为简单,几年前这些技术仍然是不可想象的。
- 利用预训练和专有语言模型结合定制化语言模型,形成一个推理框架,可以访问工具和文件,并可能连接其他代理。
- 即使面对未见过的信息或结构不符的数据,AI也能进行推理并努力理解问题。
企业平台与用户界面革命
- NVIDIA正在与全球领先的企业平台公司合作,加速其AI和数据处理平台的发展。
- 例如,Snowflake作为顶级云数据平台,与NVIDIA合作实现了显著进展。
- 代理系统将成为新的用户界面,不再依赖传统的Excel表格或命令行,而是更像人与人之间的互动。
物理AI的发展与挑战
理解物理世界
- 物理AI旨在让计算机智能能够理解现实世界中的常识,如物体持久性、因果关系等。
- AI需要学习物理法则,例如摩擦、重力和惯性,这对其理解至关重要。
数据生成与模拟的重要性
- 为了训练AI,需要创建大量关于物理现象的数据,而这类数据通常稀缺。
- 模拟环境对于评估AI行为的一致性至关重要,因为没有模拟就无法验证其反应是否符合预期。
三台计算机系统
- 基本系统需要三台计算机:一台用于训练模型,一台用于推断(如机器人),还有一台专门用于模拟。
- 模拟是NVIDIA在物理AI领域最擅长的部分,是所有工作的基础。
数字双胞胎与基础模型
数字双胞胎概念
- Omniverse被视为基于物理的数字双胞胎模拟世界,为各种应用提供支持。
基础模型的重要性
- Cosmos作为世界基础模型,不仅限于语言,还可以描述现实世界中的事件,如球体运动等。
物理AI的未来:NVIDIA Cosmos与自主驾驶
数据生成与训练AI
- 通过物理法则和真实数据,我们可以选择性地生成用于训练AI的数据,例如交通模拟器的输出。
- 合成数据是解决现实世界训练数据收集缓慢且成本高昂问题的答案,Cosmos AI能够生成基于物理的周围视频供AI学习。
NVIDIA Cosmos模型
- NVIDIA Cosmos是一个开放的基础模型,预先训练于互联网规模的视频、真实驾驶和机器人数据以及3D模拟。
- Cosmos能够从单一图像生成逼真的视频,并进行物理推理和轨迹预测,支持多种场景下的应用。
互动闭环仿真
- 开发者可以在Cosmos中运行互动闭环仿真,当采取行动时,世界会做出反应并进行分析。
- Cosmos被广泛使用,是全球领先的基础模型,为新一代物理AI做好准备。
自主驾驶技术进展
- 宣布Alpio,这是全球首个思考推理自主车辆AI,从摄像头输入到执行输出进行端到端训练。
- Alpio不仅能控制方向盘、刹车和加速,还能推理即将采取的行动及其原因。
长尾场景处理
- 在复杂驾驶场景中,Alpio能够对每个情境进行推理,并告知用户即将采取的动作。
- 驾驶长尾现象意味着无法收集所有可能场景,但通过分解为更小常见情况,可以有效应对各种挑战。
自动驾驶的未来与技术进展
合作与愿景
- Ola在观众中,梅赛德斯五年前同意与我们合作,使这一切成为可能。我们设想未来有十亿辆车在路上都是自动驾驶的,可以选择租用无人出租车或拥有自己的车辆。
技术架构
- 每辆车都将具备自动驾驶能力,并由人工智能驱动。模型层为Alpha Mayo,应用层为梅赛德斯-奔驰,这是Nvidia首次完整的技术堆栈。
进展与发布
- 我们一直在努力工作,Nvidia的第一款自动驾驶汽车将在第一季度上路,第二季度进入欧洲,第三和第四季度进入亚洲。
安全性与认证
- 梅赛德斯-Benz CLA被评为全球最安全的汽车,其系统每一行代码均经过安全认证。整个模型系统基于多样化和冗余传感器。
软件堆栈与评估机制
- 我们建立了两个相互镜像的软件堆栈,以确保安全性。政策和安全评估器会判断是否可以自信地进行自动驾驶,如果不确定,则回退到更简单的安全系统。
未来的发展方向与市场潜力
自动化愿景
- 我们的愿景是未来每一辆车、每一辆卡车都将实现自主驾驶,我们正在朝着这个目标努力。这整个堆栈是垂直整合的,与梅赛德斯-Benz共同构建并运营。
开放生态系统
- 尽管我们构建了整个堆栈,但它对生态系统开放,以便其他公司参与L4级别和无人出租车的发展。
商业机会
- 这已经成为我们的一个巨大商业机会,因为许多公司使用我们的数据处理和训练模型,包括合成数据生成等方面。
机器人技术的新纪元
机器人应用范围
- 从非自主车辆到自主车辆的转变正在发生,在接下来的十年内,大部分世界汽车将实现高度自主化。这种基本技术适用于各种机器人系统,包括移动机器人和人形机器人。
教育与培训工具
- 展示了Jetson计算机如何在Omniverse中进行训练,以及Isaac模拟器如何帮助学习机器人的技能,为开发者提供了强大的工具支持。
机器人技术的未来
机器人行业的现状与发展
- 提到多种新型机器人,包括Neurobot、Aubot和LG的新款Caterpillar机器人,后者能够通过Uber Eats送餐。
- 强调了Boston Dynamics等公司的灵活性,以及手术机器人和操控机器人的重要性,表明未来将更多讨论机器人技术。
AI与物理工业的结合
- 指出物理AI和AI物理将彻底改变各个行业,尤其是芯片设计领域,这一切都源于NVIDIA的合作伙伴。
- 介绍Cadence如何将CUDA X集成到其模拟和求解器中,以加速设计过程。
芯片设计与系统仿真
- 说明Synopsis在逻辑设计和IP方面的领导地位,而Cadence则在物理设计、布局及验证方面表现突出。
- 展望未来,将在Cadence和Synopsis内进行芯片及系统设计,并利用这些工具进行全面仿真。
制造业的变革
- 宣布Seammens也将整合NVIDIA技术,以加速制造流程,强调未来所有芯片设计都将在NVIDIA支持下完成。
- 描述制造工厂将成为巨型机器人的概念,强调计算机辅助设计的重要性。
新工业革命的开端
- 表达对NVIDIA技术帮助传统工业革命化的兴奋,并期待与Seammens共同推动这一进程。
- 强调随着全球劳动短缺加剧,对自动化和物理AI需求日益增加,这是NVIDIA与Seammens合作的重要背景。
开放模型的发展趋势
- 指出OpenAI是当前领先的开放模型生成者,并预测开放源代码模型将在多个领域占据主导地位。
银河系的尾部为何快速移动?
物理学与暗物质的发现
- 银河系的尾部运动速度与中心相同,这与牛顿物理学相悖,后者认为离太阳越远的行星绕日公转速度应越慢。
- 暗物质被发现,它占据空间但不可见。我们以维拉·鲁宾(Vera Rubin)的名字命名下一代计算机,以表彰她在这一领域的贡献。
AI计算需求激增
- 随着AI模型每年增长十倍,对NVIDIA GPU的需求也急剧上升。
- 01引入了一个拐点,使得推理不再是一次性回答,而是思考过程,引入了强化学习和大量计算。
推理过程中的计算量增加
- 计算量在预训练、后训练和测试时间扩展中大幅增加,推理时生成的token数量每年增加五倍。
- AI在思考过程中往往能产生更好的答案,因此测试时间扩展导致token数量显著上升。
AI竞争加剧
- 各公司争相追求下一个技术前沿,每次突破都会使得上一代AI token成本下降十倍。
- 这场竞争表明,计算能力越强,越能迅速达到新的技术水平。
Vera Rubin超级计算机介绍
- Vera Rubin现已全面生产,并为AI的新前沿做好准备。
- 系统由六个芯片组成,经过极端代码设计,实现双向数据共享,提高性能。
硬件架构与性能提升
- Vera CPU和两个Reuben GPU共同组装,能够提供100 petaflops的AI性能,是前一代产品的五倍。
- Connect X9提供1.66 terabits每秒的数据带宽,以支持GPU高效运作。
数据处理与连接技术创新
- Bluefield 4 DPU负责存储和安全卸载,使得计算专注于AI任务。
- Spectrum X以太网交换机具备512条通道及200 Gbit能力,将数千个机架整合成一个AI工厂。
新一代芯片设计挑战
- 我们设计了六种不同芯片,但由于摩尔定律放缓,新一代芯片无法满足不断增长的模型需求。
新一代芯片设计的革命
行业进步与极端代码设计
- 为了保持行业的持续进步,必须采用激进的极端代码设计,这意味着需要在整个系统中同时创新所有芯片。
- 每个芯片都具有革命性,Vera CPU 是其中之一,其性能在电源受限的环境下表现出色。
Vera CPU 和 Grace GPU 的特点
- Vera CPU 在单线程性能和内存容量上都有显著提升,是一个巨大的技术突破。
- Vera CPU 拥有 88 个物理核心,支持多线程,每个核心可以处理 176 个线程,实现全性能输出。
Reuben GPU 的浮点性能
- Reuben GPU 在浮点性能上是 Blackwell 的五倍,但其晶体管数量仅为 Blackwell 的 1.6 倍,显示出半导体物理学的巨大进步。
- 如果不进行极端代码设计,每年只能实现约 1.6 倍的性能提升,这是晶体管数量所限制的。
MVF FP4 张量核心技术
- MVF FP4 张量核心是一种能够动态调整精度和结构以提高吞吐量的新型处理单元。
- 此技术无法通过软件实现,因为速度过快,因此必须在处理器内部自适应执行。
新计算机机箱与网络技术
- 新款 MGX 机箱大幅简化了组装过程,从两小时缩短至五分钟,并且采用了100%液冷设计。
- Spectrox Nick 是连接所有设备的高效网络技术,被认为是全球最佳,为高性能计算提供了无与伦比的支持。
AI网络技术的革命性进展
合作与算法设计
- 合作伙伴如人工智能实验室可以创建自己的算法,以便在系统中移动数据。这种合作是世界级的,Connect X9和Vera CPU是共同设计的,但直到CX9推出之前,我们从未公开过这一点。
Spectrum X与以太网的变革
- Connect X9或CX8和Spectrum X彻底改变了人工智能领域中的以太网使用。AI所需的以太网流量更为密集,并且需要更低的延迟,这种瞬时流量激增是以太网前所未见的。
NVIDIA在网络领域的领导地位
- Spectrum X自两年前宣布以来,NVIDIA已成为全球最大的网络公司,其成功在多个安装中得到了体现,正在迅速改变AI领域。
数据中心性能提升的重要性
- 在200兆瓦或1千兆瓦的数据中心中,网络性能至关重要。例如,如果Spectrum X能够提供25%的更高吞吐量,那么即使只提高10%,也能为一个价值500亿美元的千兆瓦数据中心带来50亿美元的收益,从而使网络投资几乎是免费的。