阳光下的沈同学的回答
英伟达芯片过去8年价格上涨了7.5倍,算力提升了1000倍
Blackwell系列芯片售价将在3万——4万美元之间,研发成本上花费了大约100亿美元
Blackwell GPU的训练性能是上一代Hopper GPU的4倍,推理性能是30倍,能源效率约25倍
因为如果要训练GPT1.8万亿参数的模型,用Hopper架构的芯片来训练,可能需要8000个GPU,消耗15兆瓦电力,需要90天左右
但如果用Blackwell,只需要2000个GPU,4兆瓦的电力,能耗大幅降低
Blackwell架构芯片将于二季度发货,并将于三季度增产
并且英伟达宣布未来AI芯片将一年一迭代
2025年推出Blackwell Ultra GPU
2026年推出Rubin GPU
2027年推出Rubin Ultra GPU
推出下一代架构:2026年推出下一代架构Rubin
Spectrum-X年更:2026年,Spectrum-X1600可连接数百万个GPU
英伟达Blackwell系列包括三个型号:
1,B100
2,B200
3,Grace-Blackwell Superchip(GB200)
GB200 Grace Blackwell超级芯片其实是由2个B200芯片(4个die)和Grace CPU组合而来
Blackwell由2080亿个晶体管组成,采用台积电4nm制程
支持多达10万亿参数的模型进行AI训练和实时大语言模型(LLM)推理
两个reticle极限GPU裸片将10TB/秒的芯片到芯片链路连接成单个统一的GPU
Blackwell 将通过新的4位浮点AI支持双倍的计算和模型大小推理能力
英伟达在Blackwell架构基础上推出的一系列系统级解决方案,这些解决方案涵盖了从芯片到整机再到集群的各个层级,为客户提供了完备的AI基础设施
低能耗AI芯片推动数据中心增长
英伟达的技术可以节省98%的成本,减少97%的能源消耗
预计将采用B200和GB200系列芯片的公司包括亚马逊、谷歌、Meta、微软、OpenAI、特斯拉和xAI
英伟达表示HBM4存储器和3.2T光模块,或在2026年成为主流
英伟达Blackwell的下一代架构将是Rubin架构,新亮点是将配备HBM4内存
这意味着在2025年底,HBM4内存可能就会大规模生产
通信网络方面,英伟达首次提到了百万级GPU互连的以太网络解决方案,且预计将于2026年推出
届时,3.2T光模块或将成为主流(目前是1.6T)
散热不局限于液冷
Blackwell架构同时推出风冷DGX和液冷MGX两款服务器
DGX的AI算力提升到上一代的45倍,达到1440PFLOPS,而能耗仅为上一代的10倍
新一代DGX能搭载72个GPU,背后由NVLink 5000根电缆组成的主干支持,能为一个机架节省20kW电能
软件业务不仅是英伟达护城河,而且会成为一个巨大的生意
这些软件业务包括:CUDA、NIM、Omniverse等
英伟达再次强调了NIN和Omniverse的重要性
NVIDIA NIM推理微服务能将企业部署生成式AI应用的时间从几天压缩到几分钟
6月2日,英伟达在Computex(台湾国际电脑展)上宣布,全球2800万开发者可以下载NVIDIA NIM(Nvidia Inference Microservices),将AI模型部署在云、数据中心或工作站上,轻松地构建Copilot(一种AI助理)、ChatGPT聊天机器人等生成式AI应用
这一产品将使得模型部署时间从以前的数周缩短至短短的几分钟
数百家合作伙伴已嵌入NIM
“每家企业都希望将生成式AI添加到其运营中,但并非每家企业都拥有一支专门的AI研究团队NVIDIA NIM 集成到各个平台中,可供各个开发者使用,可在各个地方运行,它正在帮助技术行业让每个组织都能使用生成式AI。”
NVIDIA NIM 可以通过提供一种简单、标准化的方式将生成式 AI 添加到其应用程序中,大大提高了开发人员的工作效率
Omniverse:Omniverse 是一个虚拟世界模拟开发平台,该平台可以最大限度地减少模拟与现实的差距
开发者可以在 Omniverse 中测试、训练和集成所有东西
机器人可以在虚拟世界里学习如何成为机器人
英伟达的全栈能力相比于其他GPU卖家,需要考量的不再仅仅是GPU,还包括软件平台、网络服务、散热产品、配套CPU等产品
如果将芯片制造的技术能力看作英伟达的核心技术能力,那么集成式服务软件就可以看作是其商业帝国的护城河
英伟达NIM(英伟达推理微服务)将提供一个从最浅层的应用软件到最深层的硬件编程体系CUDA的直接通路
英伟达希望通过这些服务来吸引购买英伟达服务器的客户来注册英伟达企业版NVIDIA AI Enterprise 5.0,对每个GPU每年收取4500美元的费用
英伟达的软件和生态系统也有助于加速AI的应用,软件业务未来有望带来数十亿美元营收,成为高利润率业务
凭借领先GPU/DPU/CPU、硬件/软件平台和强大的生态系统,英伟达有望继续从人工智能、高性能计算、游戏和自动驾驶汽车的重大长期趋势中受益
强大的软件生态系统不仅可以推动人工智能的应用和普及,也为英伟达构建了难以跨越的竞争壁垒,一方面
英伟达正在与EDA(电子设计自动化)和系统分析供应商建立强大的合作关系这有助于在各个终端市场推广其产品
英伟达的策略就是让平台衍生出庞大的软件生态,让后者难以突破
英伟达在其软件领域面临着巨大的进入壁垒,CUDA 是其中的重要组成部分,但即使CUDA的替代品出现,Nvidia 提供软件和库的方式也有利于他们构建一个非常可靠的生态系统
英伟达企业的护城河比想象的深
Blackwell今年可能下半年会发货
英伟达最近还在投资AI制药
英国公司Relation Therapeutics开发了一个通过读取DNA以更好理解基因的大型语言模型,而这是创造新药的关键步骤
这个公司宣布获得3500万美元的新种子轮融资,由DCVC和NVIDIA(英伟达)的风险投资部门 NVentures 联合领投
英伟达还表示未来会重点投资通用机器人,让人形机器人能够将文本、语音、视频甚至现场演示作为输入那日,并对其进行处理,采取特定的通用操作
英伟达在大会上说的Project GR00T由英伟达Isaac 机器人平台工具的帮助下开发的
黄仁勋称,由Project GR00T平台提供支持的机器人将被设计为,通过观察人类行为来理解自然语言并模仿动作,使它们能快速学习协调性、灵活性和其他技能,从而适应现实世界并在与之互动,绝对不会产生机器人起义
英伟达投资的AI衍生行业非常多,很多企业都有英伟达的投资
英伟达在全面发力+投资AI