Dirbtinio intelekto kraštovaizdis išgyvena esminį pokytį. Pastaruosius trejus metus pramonės dėmesys buvo beveik visiškai sutelktas į apmokymą – skaičiavimo požiūriu brangų procesą, kurio metu didieji kalbos modeliai (LLM) mokomi mąstyti. Tačiau 2026 m. GTC programuotojų konferencijoje San Chosė mieste „Nvidia“ generalinis direktorius Jensen Huang davė ženklą, kad apmokymo dominavimo era evoliucionuoja į inferencijos erą.
Turėdama prognozuojamą 1 trilijono dolerių pajamų galimybę iki 2027 m., „Nvidia“ nebe tik kuria kūrimo variklius; ji pozicionuoja save kaip jėgą, užtikrinančią kiekvieną realaus laiko sąveiką skaitmeniniame pasaulyje. Šios strategijos pagrindas yra milžiniškas 17 mlrd. dolerių licencijavimo sandoris su lustų startuoliu „Groq“, skirtas išspręsti didžiausią pramonės kliūtį: greitį.
Norint suprasti, kodėl „Nvidia“ keičia kryptį, būtina suprasti skirtumą tarp apmokymo ir inferencijos. Jei apmokymas yra masinės enciklopedijos rašymo procesas, tai inferencija yra vartotojo veiksmas, kai jis toje knygoje ieško konkretaus fakto ir akimirksniu gauna atsakymą.
Nors apmokymui reikalingi didžiuliai GPU klasteriai, veikiantys mėnesius, inferencija vyksta kiekvieną kartą, kai vartotojas pateikia užklausą pokalbių robotui, savivaldis automobilis priima sprendimą per dalį sekundės arba medicininis DI analizuoja skenogramą. DI persikeliant iš eksperimentinių laboratorijų į visur esančius vartotojų produktus, tikimasi, kad inferencijos užduočių apimtis kelis kartus viršys apmokymo apimtis. Iš čia ir kyla 1 trilijono dolerių vertinimas. Tai perėjimas nuo smegenų kūrimo prie smegenų valdymo pasauliniu mastu.
Vienas labiausiai stebinančių pranešimų GTC 2026 konferencijoje buvo gilus „Groq“ technologijos integravimas – startuolio, kurį „Nvidia“ licencijavo už 17 mlrd. dolerių praėjusių metų pabaigoje. „Groq“ išgarsėjo savo kalbos apdorojimo blokais (LPU), kurie teikia pirmenybę „deterministiniam“ našumui – iš esmės užtikrinant, kad DI atsakymai būtų pateikiami beveik be jokio vėlavimo.
Įtraukdama „Groq“ architektūrines paslaptis į savo naująjį centrinį procesorių ir DI sistemas, „Nvidia“ sprendžia pagrindinį įmonių DI skundą: delsą. Pasaulyje, kuriame pusės sekundės vėlavimas klientų aptarnavimo robote ar finansinės prekybos algoritme gali lemti prarastas pajamas, greitis yra pagrindinė valiuta. Naujasis Huang pristatytas aparatinės įrangos rinkinys žada paleisti sudėtingiausius pasaulio modelius taip sklandžiai, kad tai primintų žmogaus pokalbį, paliekant praeityje „žodis po žodžio“ mikčiojimą, būdingą ankstesnėms DI iteracijoms.
Jensen Huang pagrindiniame pranešime pristatė naują centrinių procesorių klasę, sukurtą specialiai dirbti kartu su licencijuota „Groq“ technologija. Tai ne tik greitesnis GPU; tai specializuota sistema lustas (SoC), skirta „realaus laiko įmonei“.
| Funkcija | Ankstesnė karta (H200/B200) | Naujoji 2026 m. inferencijos sistema |
|---|---|---|
| Pagrindinis dėmesys | Modelio apmokymas ir pralaidumas | Realaus laiko inferencija ir delsa |
| Architektūra | Hopper/Blackwell | Vieninga LPU patobulinta architektūra |
| Energijos vartojimo efektyvumas | Didelis suvartojimas vienam žetonui | 40 % mažesnės energijos sąnaudos vienai inferencijai |
| Jungiamumas | NVLink 4.0 | Itin mažos delsos „Groq“ kilmės struktūra |
Ši aparatinė įranga yra tiek gynybinis, tiek puolamasis žingsnis. Gynybiniu požiūriu ji neleidžia debesijos milžinams, tokiems kaip „Amazon“ ir „Google“, paveržti rinkos dalies su savo pritaikytais inferencijos lustais (tokiais kaip „Inferentia“ ar TPU). Puolamuoju požiūriu ji nustato naują auksinį našumo standartą, kurį konkurentams bus sunku pasiekti.
Technologijų pramonei „Nvidia“ statymas už inferenciją keičia ateinančių 24 mėnesių gaires. Mes traukiamės nuo mentaliteto „didesnis yra geriau“ kalbant apie modelio dydį ir judame link eros „efektyvumas yra karalius“.
Praktinės įžvalgos verslui:
„Nvidia“ 1 trilijono dolerių prognozė yra drąsi, tačiau ji pagrįsta realybe, kad DI tampa pagrindine skaičiavimo sąsaja. Užsitikrinusi technologiją, reikalingą dominuoti inferencijos rinkoje, „Nvidia“ bando užtikrinti, kad ji išliktų nepakeičiamu DI ekonomikos stuburu.
Kaip Jensen Huang pažymėjo baigiamajame žodyje, pirmasis DI eros trilijonas dolerių buvo išleistas mokymuisi. Kitas trilijonas bus išleistas tų žinių pritaikymui realiuoju laiku. „Nvidia“ tikslas – užtikrinti, kad kiekvieną kartą, kai DI „mąsto“, jis tai darytų naudodamas jų silicį.



Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.
/ Sukurti nemokamą paskyrą