虽然流行说法认为硅谷拥有无限的资源来推动AI革命,但现实要脆弱得多。Meta,一家市值数万亿美元的公司,最近发现自己被排除在谷歌的AI工具之外,因为没有足够的电力和硅片可供分配。这一事件标志着科技界的一个重大转变。它证明了即使是数字时代的架构师也正在触及物理天花板。
Meta最近超出了其在谷歌Gemini AI模型上的分配计算能力。谷歌的回应是限制Meta的使用。这一消息令人惊讶,因为Meta并不是一家预算有限的小型初创公司。它是一家大型企业,已承诺在未来两年内向云计算投入6000亿美元。然而,金钱并不总能解决供应链问题。如果没有芯片可用,且数据中心满负荷运转,工作就会停止。这一瓶颈目前正影响着Meta处理从客户服务到有害内容删除的一切事务。
Meta向谷歌这样的直接竞争对手购买AI服务似乎有违直觉。Meta拥有自己的Llama系列模型。这些模型在开发者社区很受欢迎,并且是开源的。简单来说,Llama是Meta自主研发的引擎。然而,在涉及高级编码、诈骗检测和复杂的客户服务聊天机器人等专业任务时,Meta发现谷歌的Gemini表现更好。
Meta还出于类似目的使用Anthropic的Claude。本质上,该公司的行为就像一个拥有自己工具但为困难工作租用更强大设备的承包商。抛开术语,这意味着Meta自身的技术尚不足以高效或准确地处理其庞大的内部工作量。到3月,Meta对Gemini的依赖变得如此沉重,以至于谷歌发出了警告。谷歌告诉Meta,限制是硬性的。Meta随后不得不告诉自己的员工更有效地使用AI token,以避免这些服务彻底关闭。
把AI模型想象成一个不知疲倦的实习生。这个实习生可以在一秒钟内阅读一千页代码,或同时与一万名客户聊天。但这个实习生需要一张非常昂贵的桌子。在科技界,那张桌子就是配备了高端图形芯片的服务器。这些芯片需要消耗大量电力。当Meta要求Gemini执行任务时,它会消耗一定量的以token衡量的计算能力。
从大局来看,世界正在耗尽这些“数字办公桌”。数据中心的建设需要数年时间。电网正努力跟上电力需求。短缺如此严重,以至于谷歌自己也不得不向外界寻求帮助。谷歌最近签署了一项协议,每月向SpaceX支付9.2亿美元以使用xAI数据中心。此举是必要的,因为谷歌自身的基础设施无法承受Gemini Enterprise的额外重量。当服务提供商不得不向第三方租用空间以维持自家产品运行时,系统正处于极端压力之下。
要理解为什么这对比普通用户很重要,我们必须看看单次AI查询的经济学。从历史上看,谷歌搜索对公司来说只需花费一分钱的一小部分。AI查询要昂贵得多。它需要处理器投入更多时间,消耗更多能量。分析师现在指出,像OpenAI这样的公司尚未盈利,因为它们从订阅中获得的收入远低于电力和硬件成本。
| 行业参与者 | AI产能策略 | 主要挑战 |
|---|---|---|
| Meta | 租用Gemini和Claude,同时建设价值6000亿美元的数据中心 | 自有模型在特定任务上缺乏准确性 |
| 从SpaceX/xAI租用产能以支持Gemini Enterprise | 内部基础设施无法满足全球需求 | |
| OpenAI | 依赖Microsoft Azure | 高昂的运营成本超过当前收入 |
| 普通用户 | 支付月度订阅费用 | Token价格上涨导致功能受限 |
在日常生活中,这意味着免费或廉价AI的时代即将结束。Token价格最近飙升。这相当于数字领域的汽油价格上涨。结果是,各公司正在退缩。他们正在限制你每小时可以向AI提问的数量。为了省钱,他们还在转向更小、能力更弱的模型。Meta要求员工更有效地使用token,这正是消费者即将经历的预演。
对于普通用户来说,这种产能危机的后果已经以微妙的方式显现。你可能会注意到你最喜欢的聊天机器人突然变得更爱重复或没那么有用了。这通常是因为公司已经切换到了更便宜、更精简的模型版本,以节省计算能力。实际上,AI的“无限”感只是一种营销幻觉。
从消费者的角度来看,有三个切实的变化值得关注。首先,AI工具的订阅价格可能会上涨,或者引入更多限制性的层级。其次,曾经免费的功能将转入付费墙后,以支付token成本。第三,将推动设备端AI。这意味着科技公司将尝试让你的手机或笔记本电脑承担重任,而不是他们的数据中心。这将电力成本从公司的账单转嫁到了你的电池寿命上。
深入探究,这场产能危机是一个系统性问题。这不仅仅关乎Meta或谷歌。它关乎一个想要比现有硬件产出更多智能的世界。互联网的基础设施正在从存储信息的图书馆转变为生成内容的工厂。这家工厂需要铜、硅和电力线等物理基础,而这些基础无法以软件的速度进行扩展。
从历史上看,技术周期的移动速度快于物理世界的适应速度。我们在早期的互联网和光纤繁荣中看到了这一点。现在,我们在AI革命中看到了它。重工业是这场运动无形的支柱。没有新的发电厂和冷却系统,世界上最先进的软件也是徒劳的。Meta不得不被限制这一事实表明,我们已经达到了这个周期的一个动荡点。
归根结底,我们时代的数字原油是计算能力。正如油价影响食品杂货和旅行的成本一样,计算能力的价格也影响着我们使用的每一项数字服务的成本。谷歌和Meta的瓶颈表明,过去两年的快速扩张正在撞墙。这不一定是坏事。它可能会迫使公司从臃肿、低效的模型转向更具韧性和专业化的技术。
目前,对于普通观察者来说,情况仍然不明朗。但底线是明确的。AI热潮不再受限于人类的想象力。它受限于墙上插座的数量。这一现实将决定哪些公司能在未来五年存活下来,哪些公司会因为努力维持运营而破产。
作为用户,你应该改变对这些工具的看法。不要将AI视为像基础网页搜索那样永久、免费的公用事业。相反,将其视为一种溢价资源。观察你的数字习惯,并留意服务何时开始滞后或提供不太详细的回复。这些都是后端配给的信号。
感谢让你的智能手机工作的无形工业机制。每当你生成一张图片或提出一个复杂的问题时,数千英里外数据中心的一台服务器就会消耗可观的水和电。如果你依赖这些工具工作,请考虑多样化。不要将所有数据或工作流放入单个模型中。正如Meta所发现的,当电网紧张时,即使是最大的玩家也可能失去访问权限。将基础任务转移到本地小型模型可以让你免受云端token市场波动的影响。
来源:Financial Times, Meta Investor Relations, Google Cloud Infrastructure Reports, SpaceX/xAI Commercial Agreements.


