Dirbtinis intelektas

Didžioji DI pajėgumų siena dabar verčia technologijų milžinus normuoti energiją

„Google“ apribojo „Meta“ naudojimąsi „Gemini“ DI dėl didelio pajėgumų trūkumo, o tai rodo pokyčius, kaip technologijų milžinai valdo brangią skaičiavimo galią ir žetonus.
Didžioji DI pajėgumų siena dabar verčia technologijų milžinus normuoti energiją

Nors populiarios istorijos teigia, kad Silicio slėnis turi neribotus išteklius DI revoliucijai maitinti, realybė yra kur kas trapesnė. „Meta“, bendrovė, kurios rinkos kapitalizacija siekia trilijonus, neseniai atsidūrė situacijoje, kai jai buvo apribota prieiga prie „Google“ DI įrankių, nes tiesiog neužteko elektros ir silicio. Šis incidentas žymi reikšmingą posūkį technologijų pasaulyje. Jis įrodo, kad net skaitmeninio amžiaus architektai atsitrenkia į fizines lubas.

„Meta“ neseniai viršijo jai skirtus skaičiavimo pajėgumus „Google“ „Gemini“ DI modelyje. „Google“ į tai reagavo apribodama „Meta“ naudojimą. Ši žinia stebina, nes „Meta“ nėra maža pradedančioji įmonė su ribotu biudžetu. Tai milžiniška korporacija, per ateinančius dvejus metus įsipareigojusi skirti 600 mlrd. JAV dolerių debesų kompiuterijai. Tačiau pinigai ne visada gali išspręsti tiekimo grandinės problemas. Jei nėra laisvų lustų, o duomenų centrai dirba pilnu pajėgumu, darbas sustoja. Ši kliūtis dabar veikia viską, kaip „Meta“ tvarko procesus – nuo klientų aptarnavimo iki žalingo turinio šalinimo.

Kodėl Markui Zuckerbergui apskritai prireikė „Google“

Atrodo prieštaringa, kad „Meta“ mokėtų tiesioginiam konkurentui, tokiam kaip „Google“, už DI paslaugas. „Meta“ turi savo modelių šeimą, vadinamą „Llama“. Šie modeliai yra populiarūs kūrėjų bendruomenėje ir yra atvirojo kodo. Paprastai tariant, „Llama“ yra pačios „Meta“ sukurtas variklis. Tačiau kai prireikė specializuotų užduočių, tokių kaip pažangus programavimas, sukčiavimo aptikimas ir sudėtingi klientų aptarnavimo pokalbių robotai, „Meta“ nustatė, kad „Google“ „Gemini“ veikia geriau.

„Meta“ panašiems tikslams naudoja ir „Anthropic“ „Claude“. Iš esmės bendrovė elgiasi kaip rangovas, kuris turi savo įrankius, tačiau sudėtingiems darbams nuomojasi galingesnę įrangą. Žvelgiant giliau, tai reiškia, kad pačios „Meta“ technologija dar nebuvo pakankamai efektyvi ar tiksli, kad susidorotų su milžinišku vidiniu darbo krūviu. Iki kovo mėnesio „Meta“ priklausomybė nuo „Gemini“ tapo tokia didelė, kad „Google“ pateikė įspėjimą. „Google“ nurodė „Meta“, kad ribos yra griežtos. Tuomet „Meta“ turėjo nurodyti savo darbuotojams efektyviau naudoti DI žetonus (tokens), kad būtų išvengta visiško šių paslaugų išjungimo.

Nenuilstantis praktikantas ir elektros sąskaita

Įsivaizduokite DI modelį kaip nenuilstantį praktikantą. Šis praktikantas gali per sekundę perskaityti tūkstantį puslapių kodo arba vienu metu susirašinėti su dešimčia tūkstančių klientų. Tačiau šiam praktikantui reikia labai brangaus stalo, prie kurio jis galėtų sėdėti. Technologijų pasaulyje tas stalas yra serveris su aukščiausios klasės grafikos procesoriais. Šiems lustams reikia milžiniško kiekio elektros energijos. Kai „Meta“ prašo „Gemini“ atlikti užduotį, ji sunaudoja tam tikrą skaičiavimo galios kiekį, matuojamą žetonais.

Žvelgiant į bendrą vaizdą, pasaulyje ima trūkti šių skaitmeninių stalų. Duomenų centrų statyba trunka kelerius metus. Elektros tinklai sunkiai susidoroja su augančia paklausa. Trūkumas yra toks didelis, kad pati „Google“ turėjo ieškoti pagalbos už savo sienų. „Google“ neseniai pasirašė sutartį, pagal kurią „SpaceX“ mokės 920 mln. JAV dolerių per mėnesį už naudojimąsi „xAI“ duomenų centrais. Šis žingsnis buvo būtinas, nes pati „Google“ infrastruktūra negalėjo atlaikyti papildomo „Gemini Enterprise“ krūvio. Kai paslaugos teikėjas turi nuomotis vietą iš trečiosios šalies vien tam, kad palaikytų savo produktą, sistema patiria didžiulį spaudimą.

Kylanti žetonų ekonomikos kaina

Norėdami suprasti, kodėl tai svarbu paprastam vartotojui, turime pažvelgti į vienos DI užklausos ekonomiką. Istoriškai viena „Google“ paieška bendrovei kainuodavo tik dalį cento. DI užklausa yra kur kas brangesnė. Jai reikia daugiau procesoriaus laiko ir daugiau energijos. Analitikai dabar pastebi, kad tokios įmonės kaip „OpenAI“ dar nėra pelningos, nes pajamos iš prenumeratų yra daug mažesnės nei išlaidos elektrai ir techninei įrangai.

Pramonės dalyvis DI pajėgumų strategija Pagrindinis iššūkis
Meta Nuomojasi Gemini ir Claude, kol stato duomenų centrus už 600 mlrd. USD Nuosaviems modeliams trūksta tikslumo specifinėms užduotims
Google Nuomojasi pajėgumus iš SpaceX/xAI, kad palaikytų Gemini Enterprise Vidinė infrastruktūra negali patenkinti pasaulinės paklausos
OpenAI Pasikliauja Microsoft Azure Didelės veiklos sąnaudos viršija dabartines pajamas
Kasdienis vartotojas Moka už mėnesines prenumeratas Kylančios žetonų kainos lemia funkcijų ribojimą

Kasdienybėje tai reiškia, kad nemokamo ar pigaus DI era artėja prie pabaigos. Žetonų kainos pastaruoju metu šoktelėjo. Tai skaitmeninis benzino kainų kilimo atitikmuo. Todėl įmonės traukiasi. Jos riboja, kiek klausimų galite užduoti DI per valandą. Jos taip pat pereina prie mažesnių, mažiau pajėgių modelių, kad sutaupytų pinigų. „Meta“ nurodymas darbuotojams efektyviau naudoti žetonus yra tai, ką netrukus pajus ir vartotojai.

Ką tai reiškia jūsų skaitmeniniams įpročiams

Vidutiniam vartotojui šio pajėgumų trūkumo pasekmės jau pasireiškia subtiliais būdais. Galite pastebėti, kad jūsų mėgstamas pokalbių robotas staiga tapo labiau pasikartojantis arba mažiau naudingas. Taip dažnai nutinka todėl, kad įmonė perėjo prie pigesnės, paprastesnės modelio versijos, norėdama išsaugoti skaičiavimo galią. Praktiškai kalbant, „neribotų“ DI galimybių pojūtis yra tik rinkodaros iliuzija.

Vartotojo požiūriu, verta stebėti tris apčiuopiamus pokyčius. Pirma, DI įrankių prenumeratos kainos tikriausiai kils arba bus įvesti labiau ribojantys planai. Antra, funkcijos, kurios kažkada buvo nemokamos, taps mokamos, kad būtų padengtos žetonų išlaidos. Trečia, bus skatinamas DI naudojimas pačiame įrenginyje. Tai reiškia, kad technologijų bendrovės stengsis, jog jūsų telefonas ar nešiojamasis kompiuteris atliktų pagrindinį darbą, o ne jų duomenų centrai. Taip elektros sąnaudos perkeliamos iš įmonės sąskaitos į jūsų baterijos veikimo laiką.

Žvelgiant giliau, ši pajėgumų krizė yra sisteminė problema. Tai susiję ne tik su „Meta“ ar „Google“. Tai susiję su pasauliu, kuris nori daugiau intelekto, nei turi techninės įrangos jam sukurti. Interneto infrastruktūra keičiasi iš saugomos informacijos bibliotekos į generuojamo turinio gamyklą. Šiai gamyklai reikalingas fizinis pamatas iš vario, silicio ir elektros linijų, kurio neįmanoma išplėsti programinės įrangos greičiu.

Žvilgsnis į techninės įrangos pagrindą

Istoriškai technologijų ciklai juda greičiau, nei fizinis pasaulis spėja prisitaikyti. Tai matėme ankstyvajame interneto amžiuje ir šviesolaidžio bumo metu. Dabar tai matome su DI revoliucija. Sunkioji pramonė yra nematomas šio judėjimo pagrindas. Be naujų jėgainių ir aušinimo sistemų pažangiausia pasaulio programinė įranga yra nenaudinga. Faktas, kad „Meta“ pajėgumai turėjo būti apriboti, rodo, jog pasiekėme kritinį šio ciklo tašką.

Galiausiai, mūsų laikų skaitmeninė žalia nafta yra skaičiavimo galia. Kaip naftos kainos veikia maisto produktų ir kelionių kainas, taip skaičiavimo galios kaina veikia kiekvienos mūsų naudojamos skaitmeninės paslaugos kainą. Kliūtys „Google“ ir „Meta“ viduje rodo, kad sparčiausia pastarųjų dvejų metų plėtra atsitrenkia į sieną. Tai nebūtinai yra blogai. Tikėtina, kad tai privers įmones atsisakyti išpūstų, neefektyvių modelių ir pereiti prie atsparesnių bei specializuotų technologijų.

Kol kas paprastam stebėtojui situacija išlieka neaiški. Tačiau esmė yra akivaizdi. DI bumas nebeturi ribų žmogaus vaizduotėje, tačiau jį riboja kištukinių lizdų skaičius sienoje. Ši realybė padiktuos, kurios įmonės išgyvens ateinančius penkerius metus, o kurios bankrutuos bandydamos „išlaikyti įjungtą šviesą“.

Praktinės įžvalgos sumaniam vartotojui

Kaip vartotojas, turėtumėte pakeisti požiūrį į šiuos įrankius. Nelaikykite DI nuolatine, nemokama paslauga, pavyzdžiui, paprasta interneto paieška. Verčiau vertinkite tai kaip aukščiausios kokybės išteklių. Stebėkite savo skaitmeninius įpročius ir pastebėkite, kada paslauga pradeda veikti lėčiau arba pateikia ne tokius išsamius atsakymus. Tai yra užkulisinio normavimo ženklai.

Įvertinkite nematomą pramoninę mechaniką, kuri leidžia veikti jūsų išmaniajam telefonui. Kiekvieną kartą, kai generuojate vaizdą ar užduodate sudėtingą klausimą, serveris duomenų centre už tūkstančių kilometrų sunaudoja išmatuojamą kiekį vandens ir elektros. Jei šiais įrankiais pasikliaujate darbe, apsvarstykite galimybę juos diversifikuoti. Nesudėkite visų savo duomenų ar darbo procesų į vieną modelį. Kaip sužinojo „Meta“, net didžiausi žaidėjai gali prarasti prieigą, kai tinklas tampa per daug apkrautas. Perėjimas prie vietinio, mažo masto modelio paprastoms užduotims gali apsaugoti jus nuo debesų kompiuterija pagrįstos žetonų rinkos svyravimų.

Šaltiniai: Financial Times, Meta Investor Relations, Google Cloud Infrastructure Reports, SpaceX/xAI Commercial Agreements.

bg
bg
bg

Iki pasimatymo kitoje pusėje.

Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.

/ Sukurti nemokamą paskyrą