Intelligenza artificiale

Il grande muro della capacità AI sta costringendo i giganti tecnologici a razionare l'energia

Google ha limitato l'uso di Gemini AI da parte di Meta a causa di una grave crisi di capacità, segnalando un cambiamento nel modo in cui i giganti tecnologici gestiscono la costosa potenza di calcolo e i token.
Il grande muro della capacità AI sta costringendo i giganti tecnologici a razionare l'energia

Mentre le narrazioni popolari suggeriscono che la Silicon Valley disponga di risorse infinite per alimentare la rivoluzione dell'IA, la realtà è molto più fragile. Meta, un'azienda con una capitalizzazione di mercato di trilioni, si è recentemente trovata esclusa dagli strumenti di IA di Google perché non c'era abbastanza elettricità e silicio per tutti. Questo incidente segna un cambiamento significativo nel mondo tecnologico. Dimostra che persino gli architetti dell'era digitale stanno raggiungendo un soffitto fisico.

Meta ha recentemente superato la sua capacità di calcolo allocata sul modello di IA Gemini di Google. Google ha risposto limitando l'utilizzo di Meta. Questa notizia è sorprendente perché Meta non è una piccola startup con un budget limitato. È una multinazionale massiccia che ha impegnato 600 miliardi di dollari nel cloud computing per i prossimi due anni. Tuttavia, il denaro non può sempre risolvere un problema di catena di approvvigionamento. Se non ci sono chip disponibili e i data center sono al massimo regime, il lavoro si ferma. Questo collo di bottiglia sta ora influenzando il modo in cui Meta gestisce tutto, dal servizio clienti alla rimozione di contenuti dannosi.

Perché Mark Zuckerberg ha avuto bisogno di Google in primo luogo

Sembra controintuitivo che Meta paghi un concorrente diretto come Google per servizi di IA. Meta ha la sua famiglia di modelli chiamata Llama. Questi modelli sono popolari nella comunità degli sviluppatori e sono open source. In termini semplici, Llama è il motore fatto in casa di Meta. Tuttavia, quando si è trattato di compiti specializzati come la programmazione avanzata, il rilevamento di truffe e chatbot complessi per il servizio clienti, Meta ha scoperto che Gemini di Google offriva prestazioni migliori.

Meta utilizza anche Claude di Anthropic per scopi simili. In sostanza, l'azienda si comporta come un appaltatore che possiede i propri strumenti ma noleggia attrezzature più potenti per lavori difficili. Dietro il gergo tecnico, questo significa che la tecnologia di Meta non era ancora abbastanza efficiente o accurata per gestire il suo massiccio carico di lavoro interno. Entro marzo, la dipendenza di Meta da Gemini è diventata così pesante che Google ha emesso un avvertimento. Google ha detto a Meta che i limiti erano rigidi. Meta ha quindi dovuto dire ai propri dipendenti di utilizzare i token AI in modo più efficiente per evitare una chiusura totale di questi servizi.

L'internista instancabile e la bolletta elettrica

Pensa a un modello di IA come a un internista instancabile. Questo stagista può leggere mille pagine di codice in un secondo o chattare con diecimila clienti contemporaneamente. Ma questo stagista ha bisogno di una scrivania molto costosa su cui sedersi. Nel mondo tecnologico, quella scrivania è un server dotato di chip grafici di fascia alta. Questi chip richiedono enormi quantità di elettricità. Quando Meta chiede a Gemini di eseguire un compito, utilizza una certa quantità di potenza di calcolo misurata in token.

Guardando il quadro generale, il mondo sta finendo queste scrivanie digitali. I data center richiedono anni per essere costruiti. Le reti elettriche faticano a tenere il passo con la domanda di elettricità. La carenza è così grave che Google stessa ha dovuto cercare aiuto fuori dalle proprie mura. Google ha recentemente firmato un accordo per pagare a SpaceX 920 milioni di dollari al mese per utilizzare i data center di xAI. Questa mossa è stata necessaria perché l'infrastruttura di Google non riusciva a gestire il peso extra di Gemini Enterprise. Quando il fornitore del servizio deve affittare spazio da una terza parte solo per mantenere in funzione il proprio prodotto, il sistema è sotto estremo stress.

Il costo crescente dell'economia dei token

Per capire perché questo sia importante per l'utente medio, dobbiamo guardare all'economia di una singola query di IA. Storicamente, una ricerca su Google costava all'azienda una frazione di centesimo. Una query di IA è molto più costosa. Richiede più tempo dal processore e più energia. Gli analisti ora sottolineano che aziende come OpenAI non sono ancora redditizie perché le entrate che ottengono dagli abbonamenti sono molto inferiori al costo dell'elettricità e dell'hardware.

Attore del Settore Strategia per la Capacità AI Sfida Principale
Meta Affitta Gemini e Claude mentre costruisce data center da 600 miliardi di dollari I propri modelli mancano di precisione per compiti specifici
Google Affitta capacità da SpaceX/xAI per supportare Gemini Enterprise L'infrastruttura interna non può soddisfare la domanda globale
OpenAI Si affida a Microsoft Azure Gli alti costi operativi superano le entrate attuali
Utente Comune Paga abbonamenti mensili L'aumento dei prezzi dei token porta a limiti delle funzionalità

Nella vita di tutti i giorni, questo significa che l'era dell'IA gratuita o economica sta volgendo al termine. I prezzi dei token sono aumentati vertiginosamente di recente. Questo è l'equivalente digitale di un aumento del prezzo della benzina. Di conseguenza, le aziende stanno facendo marcia indietro. Stanno limitando il numero di domande che puoi porre a un'IA in un'ora. Si stanno anche orientando verso modelli più piccoli e meno capaci per risparmiare denaro. L'istruzione di Meta ai suoi dipendenti di usare i token in modo più efficiente è un'anteprima di ciò che sperimenteranno i consumatori.

Cosa significa questo per le tue abitudini digitali

Per l'utente medio, le conseguenze di questa crisi di capacità stanno già apparendo in modi sottili. Potresti notare che il tuo chatbot preferito è improvvisamente più ripetitivo o meno utile. Questo accade spesso perché l'azienda è passata a una versione più economica e snella del modello per preservare la potenza di calcolo. In termini pratici, la sensazione di "illimitatezza" dell'IA è un'illusione di marketing.

Dal punto di vista del consumatore, ci sono tre cambiamenti tangibili da tenere d'occhio. Primo, i prezzi degli abbonamenti per gli strumenti di IA probabilmente aumenteranno o introdurranno livelli più restrittivi. Secondo, le funzionalità che una volta erano gratuite passeranno dietro un paywall per coprire il costo dei token. Terzo, ci sarà una spinta per l'IA on-device. Ciò significa che le aziende tecnologiche cercheranno di far sì che il tuo telefono o laptop faccia il lavoro pesante invece dei loro data center. Questo sposta il costo dell'elettricità dalla bolletta dell'azienda alla durata della tua batteria.

Guardando sotto il cofano, questa crisi di capacità è un problema sistemico. Non riguarda solo Meta o Google. Riguarda un mondo che vuole più intelligenza di quanta ne abbia l'hardware per produrla. L'infrastruttura di Internet si sta trasformando da una biblioteca di informazioni archiviate a una fabbrica di contenuti generati. Questa fabbrica richiede una base fisica di rame, silicio e linee elettriche che non possono essere scalate alla velocità del software.

Uno sguardo all'ossatura hardware

Storicamente, i cicli tecnologici si muovono più velocemente di quanto il mondo fisico possa adattarsi. Lo abbiamo visto con l'internet delle origini e il boom della fibra ottica. Ora, lo vediamo con la rivoluzione dell'IA. L'industria pesante è l'ossatura invisibile di questo movimento. Senza nuove centrali elettriche e sistemi di raffreddamento, il software più avanzato del mondo è inutile. Il fatto che Meta abbia dovuto subire delle limitazioni dimostra che abbiamo raggiunto un punto volatile in questo ciclo.

In definitiva, il petrolio greggio digitale del nostro tempo è la potenza di calcolo. Proprio come i prezzi del petrolio influenzano il costo della spesa e dei viaggi, il prezzo della potenza di calcolo influenza il costo di ogni servizio digitale che utilizziamo. Il collo di bottiglia presso Google e Meta suggerisce che la rapida espansione degli ultimi due anni sta colpendo un muro. Questo non è necessariamente un male. Probabilmente costringerà le aziende ad allontanarsi da modelli gonfi ed inefficienti verso una tecnologia più resiliente e specializzata.

Per ora, la situazione rimane opaca per l'osservatore casuale. Ma il punto fondamentale è chiaro. Il boom dell'IA non è più limitato dall'immaginazione umana. È limitato dal numero di spine nel muro. Questa realtà detterà quali aziende sopravviveranno nei prossimi cinque anni e quali andranno in rovina cercando di tenere le luci accese.

Lungimiranza pratica per il consumatore esperto

Come utente, dovresti cambiare la tua prospettiva su questi strumenti. Non vedere l'IA come un'utilità permanente e gratuita come una ricerca web di base. Considerala invece come una risorsa premium. Osserva le tue abitudini digitali e nota quando un servizio inizia a rallentare o a offrire risposte meno dettagliate. Questi sono segni di razionamento nel backend.

Apprezza la meccanica industriale invisibile che fa funzionare il tuo smartphone. Ogni volta che generi un'immagine o poni una domanda complessa, un server in un data center a migliaia di chilometri di distanza consuma una quantità misurabile di acqua ed elettricità. Se ti affidi a questi strumenti per lavoro, considera la diversificazione. Non mettere tutti i tuoi dati o flussi di lavoro in un unico modello. Come ha scoperto Meta, anche i più grandi attori possono perdere l'accesso quando la rete si fa stretta. Passare a un modello locale su piccola scala per i compiti di base può salvarti dalla volatilità del mercato dei token basato sul cloud.

Fonti: Financial Times, Meta Investor Relations, Google Cloud Infrastructure Reports, SpaceX/xAI Commercial Agreements.

bg
bg
bg

Ci vediamo dall'altra parte.

La nostra soluzione di archiviazione e-mail crittografata end-to-end fornisce i mezzi più potenti per lo scambio sicuro dei dati, garantendo la sicurezza e la privacy dei tuoi dati.

/ Creare un account gratuito