Intelligence Artificielle

Le grand mur de la capacité de l'IA force désormais les géants de la technologie à rationner l'énergie

Google a plafonné l'utilisation de l'IA Gemini par Meta en raison d'une crise majeure de capacité, signalant un changement dans la gestion de la puissance de calcul et des jetons par les géants de la tech.
Le grand mur de la capacité de l'IA force désormais les géants de la technologie à rationner l'énergie

Alors que les récits populaires suggèrent que la Silicon Valley dispose de ressources infinies pour alimenter la révolution de l'IA, la réalité est bien plus fragile. Meta, une entreprise dont la capitalisation boursière se compte en milliers de milliards, s'est récemment retrouvée exclue des outils d'IA de Google parce qu'il n'y avait pas assez d'électricité et de silicium pour tout le monde. Cet incident marque un tournant significatif dans le monde de la technologie. Il prouve que même les architectes de l'ère numérique se heurtent à un plafond physique.

Meta a récemment dépassé sa capacité de calcul allouée sur le modèle d'IA Gemini de Google. Google a réagi en plafonnant l'utilisation de Meta. Cette nouvelle est surprenante car Meta n'est pas une petite startup au budget limité. C'est une corporation massive qui a promis d'investir 600 milliards de dollars dans le cloud computing au cours des deux prochaines années. Cependant, l'argent ne peut pas toujours résoudre un problème de chaîne d'approvisionnement. S'il n'y a pas de puces disponibles et que les centres de données tournent à plein régime, le travail s'arrête. Ce goulot d'étranglement affecte désormais la manière dont Meta gère tout, du service client à la suppression de contenus préjudiciables.

Pourquoi Mark Zuckerberg a eu besoin de Google en premier lieu

Il semble contre-intuitif que Meta paie un concurrent direct comme Google pour des services d'IA. Meta possède sa propre famille de modèles appelée Llama. Ces modèles sont populaires dans la communauté des développeurs et sont en open source. En termes simples, Llama est le moteur maison de Meta. Cependant, lorsqu'il s'est agi de tâches spécialisées comme le codage avancé, la détection d'escroqueries et les chatbots complexes de service client, Meta a constaté que le Gemini de Google était plus performant.

Meta utilise également Claude d'Anthropic à des fins similaires. Essentiellement, l'entreprise agit comme un entrepreneur qui possède ses propres outils mais loue du matériel plus puissant pour les travaux difficiles. Derrière le jargon, cela signifie que la propre technologie de Meta n'était pas encore assez efficace ou précise pour gérer sa charge de travail interne massive. En mars, la dépendance de Meta envers Gemini est devenue si forte que Google a émis un avertissement. Google a dit à Meta que les limites étaient fermes. Meta a alors dû demander à ses propres employés d'utiliser les jetons d'IA plus efficacement pour éviter un arrêt total de ces services.

Le stagiaire infatigable et la facture d'électricité

Considérez un modèle d'IA comme un stagiaire infatigable. Ce stagiaire peut lire mille pages de code en une seconde ou discuter avec dix mille clients à la fois. Mais ce stagiaire a besoin d'un bureau très coûteux pour s'asseoir. Dans le monde de la technologie, ce bureau est un serveur équipé de puces graphiques haut de gamme. Ces puces nécessitent des quantités massives d'électricité. Lorsque Meta demande à Gemini d'effectuer une tâche, elle utilise une certaine quantité de puissance de calcul mesurée en jetons.

Si l'on regarde la situation globale, le monde manque de ces bureaux numériques. Les centres de données prennent des années à construire. Les réseaux électriques peinent à suivre la demande d'électricité. La pénurie est si grave que Google lui-même a dû chercher de l'aide à l'extérieur de ses propres murs. Google a récemment signé un accord pour payer 920 millions de dollars par mois à SpaceX pour utiliser les centres de données de xAI. Cette décision était nécessaire car l'infrastructure propre de Google ne pouvait pas supporter le poids supplémentaire de Gemini Enterprise. Lorsque le fournisseur du service doit louer de l'espace à un tiers juste pour maintenir son propre produit en marche, le système est sous une tension extrême.

Le coût croissant de l'économie des jetons

Pour comprendre pourquoi cela importe pour l'utilisateur moyen, nous devons examiner l'économie d'une seule requête d'IA. Historiquement, une recherche Google coûtait à l'entreprise une fraction de centime. Une requête d'IA est beaucoup plus coûteuse. Elle nécessite plus de temps de processeur et plus d'énergie. Les analystes soulignent désormais que des entreprises comme OpenAI ne sont pas encore rentables car les revenus qu'elles tirent des abonnements sont bien inférieurs au coût de l'électricité et du matériel.

Acteur du secteur Stratégie de capacité d'IA Défi principal
Meta Loue Gemini et Claude tout en investissant 600 Md$ dans des centres de données Ses propres modèles manquent de précision pour des tâches spécifiques
Google Loue de la capacité à SpaceX/xAI pour soutenir Gemini Enterprise L'infrastructure interne ne peut répondre à la demande mondiale
OpenAI S'appuie sur Microsoft Azure Les coûts opérationnels élevés dépassent les revenus actuels
Utilisateur quotidien Paie des abonnements mensuels La hausse du prix des jetons entraîne des limites de fonctionnalités

Dans la vie quotidienne, cela signifie que l'ère de l'IA gratuite ou bon marché touche à sa fin. Le prix des jetons a grimpé récemment. C'est l'équivalent numérique d'une hausse du prix de l'essence. En conséquence, les entreprises font marche arrière. Elles limitent le nombre de questions que vous pouvez poser à une IA en une heure. Elles se tournent également vers des modèles plus petits et moins performants pour économiser de l'argent. L'instruction de Meta à ses employés d'utiliser les jetons plus efficacement est un aperçu de ce que les consommateurs vont vivre.

Ce que cela signifie pour vos habitudes numériques

Pour l'utilisateur moyen, les conséquences de cette crise de capacité apparaissent déjà de manière subtile. Vous pourriez remarquer que votre chatbot préféré est soudainement plus répétitif ou moins utile. Cela arrive souvent parce que l'entreprise est passée à une version moins chère et plus simplifiée du modèle pour préserver la puissance de calcul. Pratiquement parlant, le sentiment d'IA « illimitée » est une illusion marketing.

Du point de vue du consommateur, il y a trois changements tangibles à surveiller. Premièrement, les prix des abonnements pour les outils d'IA vont probablement augmenter ou introduire des niveaux plus restrictifs. Deuxièmement, des fonctionnalités qui étaient autrefois gratuites passeront derrière un mur payant pour couvrir le coût des jetons. Troisièmement, il y aura une poussée pour l'IA sur l'appareil. Cela signifie que les entreprises technologiques essaieront de faire en sorte que votre téléphone ou votre ordinateur portable fasse le gros du travail au lieu de leurs centres de données. Cela déplace le coût de l'électricité de la facture de l'entreprise vers la durée de vie de votre batterie.

En regardant sous le capot, cette crise de capacité est un problème systémique. Il ne s'agit pas seulement de Meta ou de Google. Il s'agit d'un monde qui veut plus d'intelligence qu'il n'a de matériel pour en produire. L'infrastructure de l'internet passe d'une bibliothèque d'informations stockées à une usine de contenu généré. Cette usine nécessite une base physique de cuivre, de silicium et de lignes électriques qui ne peut pas être mise à l'échelle à la vitesse des logiciels.

Zoom sur l'épine dorsale matérielle

Historiquement, les cycles technologiques avancent plus vite que le monde physique ne peut s'adapter. Nous l'avons vu avec les débuts d'internet et le boom de la fibre optique. Maintenant, nous le voyons avec la révolution de l'IA. L'industrie lourde est l'épine dorsale invisible de ce mouvement. Sans nouvelles centrales électriques et systèmes de refroidissement, le logiciel le plus avancé au monde est inutile. Le fait que Meta ait dû être plafonnée montre que nous avons atteint un point volatil dans ce cycle.

En fin de compte, le pétrole brut numérique de notre époque est la puissance de calcul. Tout comme le prix du pétrole affecte le coût des courses et des voyages, le prix de la puissance de calcul affecte le coût de chaque service numérique que nous utilisons. Le goulot d'étranglement chez Google et Meta suggère que l'expansion rapide des deux dernières années heurte un mur. Ce n'est pas nécessairement une mauvaise chose. Cela forcera probablement les entreprises à s'éloigner des modèles gonflés et inefficaces pour se diriger vers une technologie plus résiliente et spécialisée.

Pour l'instant, la situation reste opaque pour l'observateur occasionnel. Mais le message de fond est clair. Le boom de l'IA n'est plus limité par l'imagination humaine. Il est limité par le nombre de prises dans le mur. Cette réalité dictera quelles entreprises survivront aux cinq prochaines années et lesquelles feront faillite en essayant de garder les lumières allumées.

Prospective pratique pour le consommateur averti

En tant qu'utilisateur, vous devriez changer votre perspective sur ces outils. Ne considérez pas l'IA comme un service public permanent et gratuit comme une recherche web de base. Traitez-la plutôt comme une ressource premium. Observez vos habitudes numériques et remarquez quand un service commence à ralentir ou à offrir des réponses moins détaillées. Ce sont des signes de rationnement en arrière-plan.

Appréciez la mécanique industrielle invisible qui fait fonctionner votre smartphone. Chaque fois que vous générez une image ou posez une question complexe, un serveur dans un centre de données à des milliers de kilomètres consomme une quantité mesurable d'eau et d'électricité. Si vous dépendez de ces outils pour votre travail, envisagez de diversifier. Ne placez pas toutes vos données ou flux de travail dans un seul modèle. Comme Meta l'a découvert, même les plus grands acteurs peuvent perdre l'accès lorsque le réseau devient tendu. Passer à un modèle local à petite échelle pour les tâches de base peut vous épargner la volatilité du marché des jetons basé sur le cloud.

Sources : Financial Times, Meta Investor Relations, Google Cloud Infrastructure Reports, SpaceX/xAI Commercial Agreements.

bg
bg
bg

On se retrouve de l'autre côté.

Notre solution de messagerie cryptée de bout en bout et de stockage en nuage constitue le moyen le plus puissant d'échanger des données en toute sécurité, garantissant ainsi la sûreté et la confidentialité de vos données.

/ Créer un compte gratuit