2025年,戴维·布莱克韦尔(David Blackwell)去世十五年后,他的名字将成为科技界的热门话题。半导体巨头英伟达以这位数学家、博弈论专家的名字命名了其最新的超级芯片。布莱克韦尔是第一位入选美国国家科学院的非裔美国人。
Blackwell芯片将于2025年初投入量产,其发布引发了广泛期待。这款芯片将成为首批专为生成式人工智能时代设计的数据中心的基石。英伟达CEO黄仁勋将这些数据中心称为“AI工厂”。然而,随之而来的是人们对瓶颈的担忧——从芯片制造到数据中心建设,这些都源于对AI计算能力的巨大需求。
Blackwell是一款图形处理单元(GPU),这种AI主力芯片使英伟达成长为一家市值3万亿美元的巨头。作为英伟达新平台的核心组件,这款超级芯片将推动各大AI公司(特别是云服务“超大规模企业”亚马逊、微软和谷歌)建设新的服务器场。这些设施将用于生成式人工智能计算,其能源需求将达到前所未有的水平。
市场需求蓬勃发展。市场分析和研究公司Dell‘Oro分析师巴伦·冯(Baron Fung)预计,2025年用于生成式人工智能的服务器销售额将达到1470亿美元,较2024年增长超过75%,主要得益于超大规模企业对Blackwell GPU的投资。随之而来的是能源需求的激增。该公司分析师卢卡斯·贝兰(Lucas Beran)指出,数据中心的用电需求从过去的100~200兆瓦攀升至如今的300~500兆瓦。
预测机构国际能源署(IEA)估计,未来两年全球数据中心的电力消耗量将较2022年翻番,到2026年达到1000太瓦时——相当于日本的用电量。扩建电网困难重重,实现零碳供电更是挑战巨大。为应对这一问题,宾夕法尼亚州计划重启三里岛核电站为微软数据中心供电,谷歌也已向初创公司凯罗斯动力订购核反应堆。
这些新设施,无论称之为AI工厂、数据中心还是服务器场,本质上都是庞大的超级计算机。埃隆·马斯克在孟菲斯规划的“计算超级工厂”预计将配备20万个GPU。但人工智能发展的制约因素不仅限于能源和芯片供应。
打造更强大的生成式人工智能模型的压力正在考验半导体供应链。英伟达的Blackwell芯片在台积电的生产过程中遇到工程障碍,导致发布推迟。贝恩咨询顾问戴维·克劳福德(David Crawford)指出,如果GPU需求持续强劲,高带宽内存和先进封装可能出现短缺。
在地方层面,孟菲斯的环保组织正在抗议马斯克的AI工厂耗电量可能损害当地居民利益。在全球范围内,国际能源署表示,荷兰等国已因电网限制而约束数据中心建设。一些科技公司计划通过建设现场发电机来减轻电网负担,但这些发电机主要依赖天然气驱动。
新建数据中心不仅需要能源驱动AI服务器,还需要能源维持冷却系统运转。围绕Blackwell GPU构建的系统将采用闭环液体冷却技术,这项技术的需求预计将在未来一年激增。这种转变带来的影响远不止设备改造。
某些国家在建设生成式人工智能基础设施方面具有优势。中国的中央计划体系有助于统筹协调服务器场、发电厂和劳动力。但美国的贸易限制使其无法获得英伟达最先进的GPU。无论东方还是西方,建设下一代生成式人工智能基础设施都将充满挑战。
本文由未来学人编译,原文作者:The Economist,审校排版:从林,点击查看原文链接
翻译作品,原文版权归原作者所有。未来学人仅提供翻译服务,不对原文内容或观点进行任何修改或代表。如有侵权,请联系我们删除。