优何软件 首页 软件资讯 其他 查看内容

AI的杰文斯悖论,离成立还差一个英伟达

2025-3-18 21:11| 来自: 互联网| 发布者: 资讯小编

杰文斯悖论不是天然成立的。在 AI的叙事中,要让算力用得越多,就要让算力变得更便宜,也要让 AI更有用、好用。兑现杰文斯悖论已经成为了英伟达的命门,黄仁勋要在本届 GTC上,让市场再次相信他。

AI正在从技术变革和基础设施的部署期,向规模化的商业应用期转变。对于 GPU的需求也在发生根本性的变化,即从抢购 GPU快速部署算力和技术,到商业应用寻求更具性价比的算力。老黄苦心经营的卖方市场,并非一成不变。需求在呼唤新的创新。

算力成本下降的趋势已经相当明显。 Deepseek 从软硬件协同层面起了带头作用,阿里千问和百度文心接力,挑起了价格战。但是,硬件层面的算力成本也需要快速下降,即全生命周期内总持有成本( TCO)的下降。它既包括单位算力成本的下降,决定了算力的资本开支( Capex),也包括单位性能能耗的下降,决定了算力的运营开支( Opex)。

如果只是降低单位算力的成本,也就是每花一美元获得的算力的多少,很快就会遇到电力的天花板。尤其是在美国,存量电力基础设施老化,增量建设缓慢,无法支撑数据中心快速扩张。 EpochAI认为,前沿模型训练首先遇到的瓶颈就是电力问题,当前的预训练之路,在 2030年之前就会终结。推理规模落地,尤其是 DeepResearch这样昂贵的智能体技术,需要更高的算力消耗,也就更快触及电力瓶颈。


对英伟达来说,一旦算力触及了电力瓶颈,想要卖出更多的 AI芯片,就要降低它的单位算力能耗。否则,整个行业都将像 DeepSeek学习,在现有硬件的基础上,通过软硬件协同或模型优化,压榨出更多的算力——这样对于更强大的芯片的需求会变得相对淡定。

事实上,即使没有触及总电力供给的瓶颈,当 R1推出之后,美国云巨头与 AI应用企业就迅速将其部署于自己的服务器或应用之上。 AI走向商业化变化,企业就有强烈的降低成本的驱动力,要么是更便宜的资本开支,要么是更便宜的运营开支。

CoreWeave曾透露,电力大约占其基础设施成本的 10%。该企业大量采购了英伟达 AI芯片,披露该数据的时候,算力主要来自 Hopper架构芯片。 Semianalysis曾简单地算过一笔账, H100售价 3.5万美元, 8块 H100的服务器约 28万美元,它每月电力成本约为 648美元(按 0.087美元 /千瓦时的电价计算,电价更低的地区运营成本相应降低)。如果按 6年折旧,那么算力用电成本相当于 GPU成本的 15%左右。

但是, EpochAI估算,按当前英伟达芯片的发布趋势,到 2030年,每花 1美元,就能比现在多买到 8倍多的算力( FLOP),而驱动这些算力的功耗则会减少 4倍,花在电力上的成本相当于 GPU成本的 40%。即,因为推理应用阶段会在算力中占更大比重,运营成本中的电力成本占比相对上升了。只有比现在更快地降低单位算力能耗 ——或者在电价更低的地区大规模部署 ——才能大幅降低未来 AI企业的运营成本。

英伟达的芯片越来越 “烫手 ”。 A100的热设计功率( TDP)为 400瓦, H100达到了 700瓦, B200约为 1000瓦;多家分析机构预计,即将发布的 GB300约为 1400瓦,下一代 Rubin高达 1800瓦。这不仅使得芯片与机架层面频频出现设计与散热问题,量产时间较预期推迟不少时间,更有可能将用户推向拥抱更节能的定制 AI芯片。

巨头们已经开始纷纷自研芯片。谷歌找了博通还不够,计划让联发科也试试设计 TPU。英伟达的竞争对手越来越多。提升能效,正是下一代芯片与算力系统创新最重要的主题。

从 2022年底 ChatGPT发布,到 2026年下半年 Rubin正式量产,以及 2027年规模部署,算力基础设施粗放式地建设浪潮,也跨过了 5年的周期。按照互联网时代的经验,大模型也是时候进入更节能的阶段了。

前劳伦斯伯克利国家实验室研究人员乔纳森 ·库米( Jonathan Koomey),在 2000年互联网泡沫高峰期,驳斥了几乎与今天一样的“电力炒作”。当时同样有很多人预测,计算机和互联网应用最终将消耗大量电力,从 2000年到 2005年,数据中心用电量确实翻了一番,但此后增长缓慢,从 2010年到 2018年,由于芯片系统技术的进步,更是用 6%的用量增量支撑了计算量的 6倍增长。


库米最近发布报告称,在 AI热潮的早期阶段,巨头玩家们争相获得算力部署新兴的技术,效率往往并不是首要考虑,但随着部署限制逐步显现,行业将会用效率来缓解这种限制。尽管摩尔定律,在放缓,登纳德定律 ( Dennard Scaling) 所定义的芯片能效逐步失效,但除了在软件与算法层面寻求优化,硬件仍然可以在定制化、集成化和立体化设计等方向,甚至新的材料或新的计算模式(如量子计算)上进行创新。

谁解决了这个问题,谁从产业中赢得更多的利润。这是黄仁勋需要在即将到来的 GTC演讲上,给出一个能源答案。


路过

雷人

握手

鲜花

鸡蛋

最新评论