关闭广告

公布未来三年路线图,黄仁勋把英伟达「逼到」极限

雷峰网205人阅读


NVIDIA 创始人兼首席执行官黄仁勋在COMPUTEX 2024开幕前,面向现场6500多名观众的演讲,最引人注意的就是最新的产品路线图。

黄仁勋展示了未来三年的产品路线图,并首次公布下一代平台Rubin。

看起来,黄仁勋将英伟产品的更新节奏推向了技术的极限,近些年有类似节奏的公司是以消费市场为主的苹果,这表达了NVIDIA“加速一切”决心的同时,也预示着AI应用蓬勃发展的阶段即将到来。

GPU架构、网络平台Spectrum-X每年更新的同时,NVIDIA也在推动加速计算成本的降低、有降低AI应用嫩看的NIM推理微服务,以及推动AI新一波浪潮的机器人等。

可以越来越清晰的看到,NVIDIA要成为AI世界里的基石。

黄仁勋海给出预测,AI新一波浪潮是物理AI。

GPU、以太网网络平台每年更新

黄仁勋COMPUTEX 2024开幕前的演讲,首次披露今年发布的Blackwell架构的继任平台Rubin。


Rubin平台将配备新 GPU、基于 Arm 的新 CPU — Vera,以及采用 NVLink 6、CX9 SuperNIC 和 X1600、并融合 InfiniBand/以太网交换机的高级网络平台。

根据NVIDIA的路线图,2025年推出Blackwell Ultra GPU(8S HBM3e 12H);2026年推出Rubin GPU(8S HBM4);2027年推出Rubin Ultra GPU(12S HBM4)。

Rubin和Vera的命名均源自美国天文学家Vera Rubin。

“我展示的所有芯片都在百分之百在开发中。”黄仁勋说,“NVIDIA的更新节奏以年为单位,所有架构都是兼容的,以一年为周期,我们把所有东西推向技术极限。”

黄仁勋称以年为单位更新的基本理念非常简单,打造数据中心规模,以每年的节奏分步骤实现、并向客户交付产品,在各个领域实现技术突破。

同样计划每年推出新产品的还有Spectrum-X产品。NVIDIA Spectrum-X 是全球首款专为 AI 打造的以太网网络平台,可将网络性能较传统以太网网络平台提升1.6倍。


Spectrum-X 为客户提供更高的带宽、更多的端口、更加强大的软件功能集与可编程能力,不断提高领先的AI以太网网络性能。

网络和存储越来越成为限制AI发展的瓶颈。

NVIDIA网络高级副总裁Gilad Shainer说:“生成式 AI 等开创性技术的飞速发展,使每家企业都必须把网络创新放在第一位,从而获得竞争优势。

Spectrum-X配备NVIDIA Spectrum SN5600以太网交换机和NVIDIA BlueField -3 SuperNIC,是一个兼顾了生成式 AI 云所需高性能和各种云功能的端到端平台。

雷峰网了解到,率先采用NVIDIA Spectrum-X的AI云服务提供商有CoreWeave、GMO Internet Group、Lambda、Scaleway、STPX Global 和 Yotta 等。

另外,戴尔科技、慧与、联想和超微等之后,又有多家NVIDIA 合作伙伴也发布了基于 Spectrum 的产品,包括永擎电子(ASRock Rack)、华硕(ASUS)、技嘉科技(GIGABYTE)、鸿佰科技(Ingrasys)、英业达(Inventec)、和硕(Pegatron)、云达科技(QCT)、纬创(Wistron)和纬颖科技(Wiwynn)等。

MGX和NIM降AI应用的软硬件门槛

身处2024年更应该意识到,AI的发展不仅需要GPU、CPU、网络等关键组件,更需要一个易用且低成本的AI系统。

NVIDIA 正在降低将数据转化为智能的成本。


“买的越多,省的越多。”黄仁勋说,CPU的性能扩展已经大大放缓,NVIDIA通过GPU+CPU组合,实现了高达100倍的加速,同时功耗仅增加到3倍,成本仅增加到1.5倍,每瓦性能比单独使用CPU提高25倍。

有更加直观的数据,8年内NVIDIA AI算力增加了1000倍,带来的显著收益是,比如训练1.8万亿参数、8万亿token的GPT-4,所需能耗从8年前Pascal架构的1000GWh减少到Blackwell的3GWh,能耗仅为8年前的1/350。


生成Token的能耗,Blackwell架构降至8年前Pascal架构的1/45000。

用Pascal产生1 Token的能耗相当于2个200W灯泡运行2天,而现在1 Token只用0.4J能耗。

MGX降低AI工厂建立成本和时间

架构演进带来的优势最终还是需要以系统应用的方式呈现,并且要以足够低的软硬件门槛。

为了加快不同规模和配置的系统开发,NVIDIA推出了MGX模块化参考设计平台,以便计算机制造商能够以快速且低成本的方式构建超过 100 种的系统设计配置。

制造商首先可根据其服务器机箱选择一种基本的系统架构,然后再根据不同的工作负载选择 GPU、DPU 和 CPU。通过采用 MGX,开发成本大幅降低,较之前最多降低了四分之三,开发时间缩短到仅六个月,较之前减少了三分之二。

目前,已有超过 25 家合作伙伴的 90 多套已发布或正在开发中的系统使用了 MGX 参考架构。AMD和英特尔也都支持MGX 架构,并首次计划打造基于他们自己 CPU 主机处理器的模块设计。


“新一轮工业革命已经开始。众多企业和地区正在与 NVIDIA 合作推动价值万亿美元的传统数据中心向加速计算转型,并建造一种新型数据中心——AI 工厂来生产新的商品:人工智能。“黄仁勋宣布,NVIDIA MGX模块化参考设计平台加入了对 NVIDIA Blackwell 产品的支持,包括全新 NVIDIA GB200 NVL2 平台,这些系统搭载 Grace CPU 以及 NVIDIA 网络和基础设施,将帮助企业建立 AI 工厂和数据中心。

NIM让2800万开发者轻松创建AI应用

有了AI工厂和数据中心,就拥有了激发AI创新的硬件基础。

每个企业都希望在其运营中融入生成式 AI,但并非每个企业都拥有专门的 AI 研究团队。

NVIDIA给出的解决方案是NIM,这是一种推理微服务,通过经优化的容器的形式提供模型——以部署在云、数据中心或工作站上。


借助 NVIDIA NIM,开发者能够轻松地为 Copilots、聊天机器人等构建生成式 AI 应用,所需时间从数周缩短至几分钟,NVIDIA宣布全球2,800 万开发者已经可以下载 NVIDIA NIM。

NIM能帮助企业实现基础设施投资的效果最大化。例如,与未使用 NIM 的情况相比,在NIM中运行Meta Llama 3-8B所能生成的加速基础设施AI Token可以提升3倍。

据悉,从Meta Llama 3开始,在Hugging Fac上现已开始提供 NIM,NVIDIA已经在 Hugging Face上发布了全面优化的Llama 3。

通过基于 NVIDIA GPU 的 Hugging Face 推理端点,只需点击几下,开发者就能在其选择的云平台上轻松地访问和运行 Llama 3 NIM,能有效降低开发AI应用的门槛。

企业可以使用 NIM 来运行用于生成文本、图像和视频、语音以及数字人的应用。借助面向数字生物学的 NVIDIA BioNeMo NIM 微服务,研究人员可以构建新的蛋白质结构,加速药物研发。

目前Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI 和新思科技等近 200 家NVIDIA的技术合作伙伴正将NIM集成到他们的平台中,加快生成式AI部署到特定领域应用中的速度,例如Copilots、代码助手、数字人虚拟形象等。

价值50万亿美元的工业数字化变革

AI将带来的变革,触手可及的是AI PC。

搭载RTX技术的NVIDIA RTX AI PC将通过200多款RTX AI笔记本电脑和500多款采用 AI 技术的应用和游戏改变消费者的体验。


NVIDIA还发布了搭载RTX的AI助手技术演示G-Assist 项目,展示了针对PC游戏和应用的上下文感知辅助功能。

除了消费级市场,NVIDIA也将目光放到了价值 50 万亿美元的工业数字化变革。

面对各行各业采用自主运营和数字孪生,通过虚拟模型提高效率并降低成本对需求。NVIDIA 通过其开发者计划提供对 NIM 的访问权限,以促进 AI 创新。

黄仁勋展示了Foxconn利用NVIDIA Omniverse、Isaac 和 Metropolis 创建数字孪生,通过结合视觉AI与机器人开发工具来实现增强的机器人设施。

AI新一波浪潮是物理AI。AI能够理解物理定律,并与人类并肩作战,”黄仁勋他强调了机器人和人工智能在未来发展中的重要性。

如今大多数AI并不理解物理定律,不以物质世界为基础。而生成图像、视频、3D图形和许多物理现象,需要基于物理并理解物理定律的AI。


“机器人和物理 AI 正在成为现实,而不仅是出现在科幻小说。这真的令人兴奋,”黄仁勋补充。

NVIDIA Isaac平台为开发者构建 AI 机器人提供强大的套件,包括由AI模型以及Jetson Orin、Thor 等超级计算机驱动的AMR、工业机械臂和人形机器人。

“机器人将遍布所有工厂。工厂将实现对机器人的统筹,而这些机器人将制造新的机器人产品,”黄仁勋同时强调NVIDIA Isaac 在提高工厂和仓库效率方面的作用,比亚迪电子、西门子、泰瑞达、Intrinsic 等全球领先企业都在使用 NVIDIA Isaac 的高级程序库和 AI 模型。

从核心组件到整个AI系统,NVIDIA已经成为加速AI发展的基石。

同时,NVIDIA给出了AI新一波浪潮是物理AI也传递出NVIDIA对于未来的判断与引领。雷峰网

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

富力老板深陷“行贿案”!富二代却逃过一劫

金融八卦女 浏览 294

戛纳闭幕式:范冰冰宛若女王,精灵王子略显沧桑

闲聊小神龙 浏览 264

克劳奇:希望看到赖斯加盟利物浦,他是一名团队型球员

直播吧 浏览 322

天舟六号船箭组合体转运至发射区 将于近日择机发射

环球网资讯 浏览 492

空军西安飞行学院某旅开展跨昼夜飞行训练

人民资讯 浏览 226

港娱第一演员家庭,谢贤“爷孙恋”,孙子同居46岁女友,奇葩大瓜

娱乐白名单 浏览 115

芬兰加入北约扭转军事不结盟历史,克宫:俄将被迫采取反制措施

澎湃新闻 浏览 282

罗马诺:皇马因6000万欧转会费太高放弃哈弗茨,谈判已经停止

直播吧 浏览 267

卡德罗夫下令车臣禁止高额彩礼 限额5万卢布以内

环球网资讯 浏览 273

想让头显跳出宅男圈,科技公司纷纷为女性开发VR健身应用

网易科技报道 浏览 492

夫妻带走无人照看的狗获刑 当公务员的妻子被停发工资

封面新闻 浏览 320

美国否认美制武器在俄罗斯境内被摧毁

环球网资讯 浏览 279

超震撼!独家视频首次发布

半月谈APP 浏览 222

贾玲这场床戏,不该被嘲笑

独立鱼 浏览 269

余承东:华为对赛力斯的投入在增加 不会涉及20万价位以下市场

财联社 浏览 548

恩里克:当姆巴佩想上场时,我没什么好说的,只需要看和享受

懂球帝 浏览 253

李尚福在北京会见俄罗斯海军总司令

国防部发布 浏览 436

村民拒绝自家土地流转提出质疑 副镇长:有多远滚多远

燕赵都市报纵览新闻 浏览 340

媒体:瓦格纳从莫斯科掉头转向基辅 美国现在有点懵

上游新闻 浏览 277

王思聪带30位网红庆生蛋糕烟花太壕 新女友送祝福

萌神木木 浏览 1416

微软计划最早明年推出手机游戏商店,与苹果和谷歌竞争

界面新闻 浏览 675
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-2