Sztuczna inteligencja

Wielka ściana wydajności AI zmusza gigantów technologicznych do racjonowania energii

Google ograniczyło dostęp Meta do AI Gemini z powodu poważnego deficytu wydajności, co sygnalizuje zmianę w sposobie zarządzania drogą mocą obliczeniową i tokenami przez gigantów technologicznych.
Wielka ściana wydajności AI zmusza gigantów technologicznych do racjonowania energii

Podczas gdy popularne narracje sugerują, że Dolina Krzemowa dysponuje nieskończonymi zasobami do napędzania rewolucji AI, rzeczywistość jest znacznie bardziej krucha. Meta, firma o kapitalizacji rynkowej idącej w biliony, została niedawno odcięta od narzędzi AI Google, ponieważ zabrakło energii elektrycznej i krzemu. Incydent ten oznacza znaczącą zmianę w świecie technologii. Dowodzi on, że nawet architekci ery cyfrowej uderzają w fizyczny sufit.

Meta przekroczyła ostatnio przydzieloną jej wydajność obliczeniową w modelu AI Gemini od Google. W odpowiedzi Google ograniczyło użycie Meta. Ta wiadomość jest zaskakująca, ponieważ Meta nie jest małym startupem z ograniczonym budżetem. To potężna korporacja, która zadeklarowała 600 miliardów dolarów na przetwarzanie w chmurze w ciągu najbliższych dwóch lat. Jednak pieniądze nie zawsze mogą rozwiązać problem z łańcuchem dostaw. Jeśli nie ma dostępnych czipów, a centra danych pracują na pełnych obrotach, praca staje. To wąskie gardło wpływa teraz na wszystko, co robi Meta – od obsługi klienta po usuwanie szkodliwych treści.

Dlaczego Mark Zuckerberg w ogóle potrzebował Google

Wydaje się to sprzeczne z intuicją, że Meta miałaby płacić bezpośredniemu konkurentowi, takiemu jak Google, za usługi AI. Meta posiada własną rodzinę modeli o nazwie Llama. Modele te są popularne w społeczności programistów i mają otwarty kod źródłowy. Mówiąc prościej, Llama to własny silnik Meta. Jednak w przypadku specjalistycznych zadań, takich jak zaawansowane programowanie, wykrywanie oszustw i złożone chatboty obsługi klienta, Meta uznała, że Gemini od Google radzi sobie lepiej.

Meta korzysta również z modelu Claude od Anthropic w podobnych celach. W zasadzie firma zachowuje się jak wykonawca, który posiada własne narzędzia, ale wynajmuje potężniejszy sprzęt do trudnych zadań. Przekładając żargon na prostszy język, oznacza to, że własna technologia Meta nie była jeszcze wystarczająco wydajna ani dokładna, aby poradzić sobie z ogromnym wewnętrznym obciążeniem pracą. Do marca zależność Meta od Gemini stała się tak duża, że Google wydało ostrzeżenie. Google poinformowało Meta, że limity są nieprzekraczalne. Meta musiała wtedy nakazać własnym pracownikom bardziej efektywne korzystanie z tokenów AI, aby uniknąć całkowitego wyłączenia tych usług.

Niestrudzony stażysta i rachunek za prąd

Pomyśl o modelu AI jak o niestrudzonym stażyście. Ten stażysta potrafi przeczytać tysiąc stron kodu w sekundę lub rozmawiać z dziesięcioma tysiącami klientów naraz. Ale ten stażysta potrzebuje bardzo drogiego biurka. W świecie technologii tym biurkiem jest serwer wyposażony w wysokiej klasy czipy graficzne. Czipy te wymagają ogromnych ilości energii elektrycznej. Kiedy Meta prosi Gemini o wykonanie zadania, zużywa określoną ilość mocy obliczeniowej mierzoną w tokenach.

Patrząc na szerszy obraz, światu kończą się te cyfrowe biurka. Budowa centrów danych zajmuje lata. Sieci energetyczne mają trudności z nadążeniem za zapotrzebowaniem na prąd. Niedobór jest tak poważny, że samo Google musiało szukać pomocy na zewnątrz. Google podpisało niedawno umowę na płacenie SpaceX 920 milionów dolarów miesięcznie za korzystanie z centrów danych xAI. Ten krok był konieczny, ponieważ własna infrastruktura Google nie była w stanie udźwignąć dodatkowego ciężaru Gemini Enterprise. Kiedy dostawca usługi musi wynajmować miejsce od strony trzeciej tylko po to, by utrzymać własny produkt, system znajduje się pod ekstremalnym obciążeniem.

Rosnące koszty gospodarki tokenowej

Aby zrozumieć, dlaczego ma to znaczenie dla przeciętnego użytkownika, musimy przyjrzeć się ekonomii pojedynczego zapytania AI. Historycznie wyszukiwanie w Google kosztowało firmę ułamek pensa. Zapytanie AI jest znacznie droższe. Wymaga więcej czasu procesora i więcej energii. Analitycy wskazują obecnie, że firmy takie jak OpenAI nie są jeszcze rentowne, ponieważ przychody z subskrypcji są znacznie niższe niż koszty energii elektrycznej i sprzętu.

Gracz rynkowy Strategia dotycząca wydajności AI Główne wyzwanie
Meta Wynajmuje Gemini i Claude, budując jednocześnie centra danych za 600 mld USD Własne modele wykazują brak dokładności w specyficznych zadaniach
Google Wynajmuje wydajność od SpaceX/xAI, aby wspierać Gemini Enterprise Wewnętrzna infrastruktura nie może zaspokoić globalnego popytu
OpenAI Polega na Microsoft Azure Wysokie koszty operacyjne przewyższają obecne przychody
Zwykły użytkownik Płaci za miesięczne subskrypcje Rosnące ceny tokenów prowadzą do ograniczeń funkcji

W codziennym życiu oznacza to, że era darmowej lub taniej sztucznej inteligencji dobiega końca. Ceny tokenów gwałtownie wzrosły w ostatnim czasie. Jest to cyfrowy odpowiednik podwyżki cen benzyny. W rezultacie firmy wycofują się. Ograniczają liczbę pytań, jakie można zadać AI w ciągu godziny. Przechodzą również na mniejsze, mniej wydajne modele, aby oszczędzać pieniądze. Instrukcja Meta dla pracowników dotycząca efektywniejszego korzystania z tokenów to zapowiedź tego, czego doświadczą konsumenci.

Co to oznacza dla Twoich cyfrowych nawyków

Dla przeciętnego użytkownika konsekwencje tego kryzysu wydajności już pojawiają się w subtelny sposób. Możesz zauważyć, że Twój ulubiony chatbot nagle stał się bardziej powtarzalny lub mniej pomocny. Często dzieje się tak dlatego, że firma przeszła na tańszą, bardziej uproszczoną wersję modelu, aby oszczędzać moc obliczeniową. Z praktycznego punktu widzenia, uczucie "nieograniczoności" AI jest iluzją marketingową.

Z punktu widzenia konsumenta należy zwrócić uwagę na trzy wymierne zmiany. Po pierwsze, ceny subskrypcji narzędzi AI prawdopodobnie wzrosną lub zostaną wprowadzone bardziej restrykcyjne pakiety. Po drugie, funkcje, które kiedyś były darmowe, trafią za paywall, aby pokryć koszty tokenów. Po trzecie, nastąpi nacisk na AI działające bezpośrednio na urządzeniu (on-device AI). Oznacza to, że firmy technologiczne będą starały się, aby to Twój telefon lub laptop wykonywał ciężką pracę zamiast ich centrów danych. Przenosi to koszt energii elektrycznej z rachunku firmy na żywotność Twojej baterii.

Patrząc głębiej, ten kryzys wydajności jest problemem systemowym. Nie chodzi tylko o Meta czy Google. Chodzi o świat, który chce więcej inteligencji, niż posiada sprzętu do jej wyprodukowania. Infrastruktura internetu zmienia się z biblioteki przechowywanych informacji w fabrykę generowanych treści. Fabryka ta wymaga fizycznych fundamentów z miedzi, krzemu i linii energetycznych, których nie da się skalować z prędkością oprogramowania.

Spojrzenie na fundament sprzętowy

Historycznie cykle technologiczne poruszają się szybciej niż świat fizyczny jest w stanie się zaadaptować. Widzieliśmy to we wczesnej fazie internetu i podczas boomu na światłowody. Teraz widzimy to w przypadku rewolucji AI. Przemysł ciężki jest niewidocznym kręgosłupem tego ruchu. Bez nowych elektrowni i systemów chłodzenia najbardziej zaawansowane oprogramowanie na świecie jest bezużyteczne. Fakt, że Meta musiała zostać ograniczona, pokazuje, że dotarliśmy do punktu krytycznego w tym cyklu.

Ostatecznie cyfrową ropą naftową naszych czasów jest moc obliczeniowa. Tak jak ceny ropy wpływają na koszty żywności i podróży, tak cena mocy obliczeniowej wpływa na koszt każdej usługi cyfrowej, z której korzystamy. Wąskie gardło w Google i Meta sugeruje, że gwałtowna ekspansja ostatnich dwóch lat uderza w ścianę. Niekoniecznie jest to zła rzecz. Prawdopodobnie zmusi to firmy do odejścia od rozdętych, nieefektywnych modeli na rzecz bardziej odpornych i wyspecjalizowanych technologii.

Na razie sytuacja pozostaje niejasna dla przypadkowego obserwatora. Ale wniosek jest jasny. Boom na AI nie jest już ograniczony ludzką wyobraźnią. Jest ograniczony liczbą gniazdek w ścianie. Ta rzeczywistość podyktuje, które firmy przetrwają najbliższe pięć lat, a które zbankrutują, próbując utrzymać włączone światło.

Praktyczne przewidywania dla świadomego konsumenta

Jako użytkownik powinieneś zmienić swoje podejście do tych narzędzi. Nie traktuj AI jako stałego, darmowego narzędzia, takiego jak podstawowe wyszukiwanie w sieci. Zamiast tego traktuj je jako zasób premium. Obserwuj swoje cyfrowe nawyki i zauważaj, kiedy usługa zaczyna zwalniać lub oferować mniej szczegółowe odpowiedzi. To oznaki racjonowania zasobów na zapleczu.

Doceniaj niewidoczną mechanikę przemysłową, dzięki której Twój smartfon działa. Za każdym razem, gdy generujesz obraz lub zadajesz złożone pytanie, serwer w centrum danych oddalonym o tysiące kilometrów zużywa mierzalną ilość wody i energii elektrycznej. Jeśli polegasz na tych narzędziach w pracy, rozważ dywersyfikację. Nie umieszczaj wszystkich swoich danych ani procesów w jednym modelu. Jak odkryła Meta, nawet najwięksi gracze mogą stracić dostęp, gdy sieć staje się przeciążona. Przejście na lokalny, małoskalowy model do podstawowych zadań może uchronić Cię przed zmiennością rynku tokenów opartego na chmurze.

Źródła: Financial Times, Meta Investor Relations, Google Cloud Infrastructure Reports, SpaceX/xAI Commercial Agreements.

bg
bg
bg

Do zobaczenia po drugiej stronie.

Nasze kompleksowe, szyfrowane rozwiązanie do poczty e-mail i przechowywania danych w chmurze zapewnia najpotężniejsze środki bezpiecznej wymiany danych, zapewniając bezpieczeństwo i prywatność danych.

/ Utwórz bezpłatne konto