Tehisintellekti maastik on läbi tegema põhjalikku muutust. Viimase kolme aasta jooksul on tööstuse fookus olnud peaaegu täielikult treenimisel — arvutuslikult kallis protsess, mille käigus õpetatakse suurtele keelemudelitele (LLM), kuidas mõelda. Kuid 2026. aasta GTC arendajate konverentsil San Joses andis Nvidia tegevjuht Jensen Huang märku, et treenimise domineerimise ajastu on evolutsioneerumas inferentsi ehk järeldamise ajastuks.
Prognoositava 1 triljoni dollari suuruse tuluvõimalusega 2027. aastaks ei ehita Nvidia enam lihtsalt loomemootoreid; ettevõte positsioneerib end toitma iga reaalajas toimuvat interaktsiooni digitaalses maailmas. Selle strateegia keskmes on massiivne 17 miljardi dollari suurune litsentsileping kiibi-idufirmaga Groq, mille eesmärk on lahendada tööstuse suurim pudelikael: kiirus.
Mõistmaks, miks Nvidia suunda muudab, peab mõistma erinevust treenimise ja inferentsi vahel. Kui treenimine on nagu massiivse entsüklopeedia kirjutamine, siis inferents on toiming, kus kasutaja otsib sellest raamatust konkreetset fakti ja saab vastuse koheselt.
Kuigi treenimine nõuab massiivseid GPU-klastreid, mis töötavad kuid, toimub inferents iga kord, kui kasutaja esitab juturobotile päringu, isesõitev auto teeb sekundi murdosa jooksul otsuse või meditsiiniline tehisintellekt analüüsib uuringut. Kuna tehisintellekt liigub eksperimentaalsetest laboritest üldlevinud tarbekaupadesse, eeldatakse, et inferentsiülesannete maht ületab treenimise mahu mitmekordselt. Siit pärinebki 1 triljoni dollari suurune hinnang. See on nihe aju ehitamiselt aju käitamisele globaalses ulatuses.
Üks üllatavamaid teadaandeid GTC 2026 konverentsil oli Nvidia poolt eelmisel aastal 17 miljardi dollari eest litsentseeritud idufirma Groq tehnoloogia sügav integreerimine. Groq sai tuntuks oma keeletöötlusüksustega (LPU), mis seavad prioriteediks "deterministliku" jõudluse — tagades sisuliselt selle, et tehisintellekti vastused edastatakse peaaegu olematu viivitusega.
Lisades Groqi arhitektuurilised saladused oma uude keskprotsessorisse ja AI-süsteemidesse, lahendab Nvidia ettevõtete tehisintellekti peamist murekohta: latentsust. Maailmas, kus poole sekundiline viivitus klienditeenindusbotis või finantskauplemise algoritmis võib tähendada saamata jäänud tulu, on kiirus ülim valuuta. Huangi avalikustatud uus riistvarakomplekt lubab käitada maailma keerukamaid mudeleid sujuvusega, mis imiteerib inimestevahelist vestlust, jättes seljataha varasematele AI-iteratsioonidele omase "sõna-sõnalt" kokutamise.
Jensen Huangi ettekanne tutvustas uut klassi keskprotsessoreid, mis on loodud spetsiaalselt töötama tandemis litsentseeritud Groqi tehnoloogiaga. See ei ole lihtsalt kiirem GPU; see on spetsialiseeritud süsteem kiibil (SoC), mis on loodud "reaalajas ettevõtte" jaoks.
| Funktsioon | Eelmine põlvkond (H200/B200) | Uus 2026. aasta inferentsisüsteem |
|---|---|---|
| Peamine fookus | Mudeli treenimine ja läbilaskevõime | Reaalajas inferents ja latentsus |
| Arhitektuur | Hopper/Blackwell | Ühtne LPU-ga täiustatud arhitektuur |
| Energiatõhusus | Kõrge tarbimine märgi (token) kohta | 40% vähem energiat inferentsi kohta |
| Ühendustehnoloogia | NVLink 4.0 | Ülimadala latentsusega Groq-põhine siin |
See riistvara kujutab endast nii kaitsvat kui ka ründavat sammu. Kaitsvalt takistab see pilvehiidudel nagu Amazon ja Google turuosa varastamist oma kohandatud inferentsikiipidega (nagu Inferentia või TPU-d). Ründavalt seab see uue jõudluse kuldstandardi, millega konkurentidel on raske sammu pidada.
Tehnoloogiatööstuse jaoks muudab Nvidia panus inferentsile järgmise 24 kuu teekaarti. Oleme liikumas mudeli suuruse osas mõttelaadilt "suurem on parem" ajastusse, kus "efektiivsus on kuningas".
Praktilised järeldused ettevõtetele:
Nvidia 1 triljoni dollari suurune prognoos on julge, kuid see põhineb reaalsusel, et tehisintellekt on muutumas arvutite kasutamise peamiseks liideseks. Kindlustades tehnoloogia, mis on vajalik inferentsituru domineerimiseks, üritab Nvidia tagada, et ta jääks tehisintellekti majanduse asendamatuks selgrooks.
Nagu Jensen Huang oma lõppsõnas märkis, kulutati tehisintellekti ajastu esimene triljon dollarit õppimisele. Järgmine triljon kulutatakse nende teadmiste rakendamisele reaalajas. Nvidia eesmärk on tagada, et iga kord, kui tehisintellekt "mõtleb", teeks ta seda nende räni peal.



Meie läbivalt krüpteeritud e-posti ja pilvesalvestuse lahendus pakub kõige võimsamaid vahendeid turvaliseks andmevahetuseks, tagades teie andmete turvalisuse ja privaatsuse.
/ Tasuta konto loomin