Pramonės naujienos

„Nvidia“ 1 trilijono dolerių posūkis: kodėl inferencijos rinka yra naujoji DI riba

„Nvidia“ iki 2027 m. taikosi į 1 trilijono dolerių pajamų galimybę, orientuodamasi į DI inferenciją su 17 mlrd. dolerių vertės „Groq“ technologijų sandoriu ir naujais realaus laiko DI procesoriais.
„Nvidia“ 1 trilijono dolerių posūkis: kodėl inferencijos rinka yra naujoji DI riba

Dirbtinio intelekto kraštovaizdis išgyvena esminį pokytį. Pastaruosius trejus metus pramonės dėmesys buvo beveik visiškai sutelktas į apmokymą – skaičiavimo požiūriu brangų procesą, kurio metu didieji kalbos modeliai (LLM) mokomi mąstyti. Tačiau 2026 m. GTC programuotojų konferencijoje San Chosė mieste „Nvidia“ generalinis direktorius Jensen Huang davė ženklą, kad apmokymo dominavimo era evoliucionuoja į inferencijos erą.

Turėdama prognozuojamą 1 trilijono dolerių pajamų galimybę iki 2027 m., „Nvidia“ nebe tik kuria kūrimo variklius; ji pozicionuoja save kaip jėgą, užtikrinančią kiekvieną realaus laiko sąveiką skaitmeniniame pasaulyje. Šios strategijos pagrindas yra milžiniškas 17 mlrd. dolerių licencijavimo sandoris su lustų startuoliu „Groq“, skirtas išspręsti didžiausią pramonės kliūtį: greitį.

Nuo apmokymo iki inferencijos: ekonominis posūkis

Norint suprasti, kodėl „Nvidia“ keičia kryptį, būtina suprasti skirtumą tarp apmokymo ir inferencijos. Jei apmokymas yra masinės enciklopedijos rašymo procesas, tai inferencija yra vartotojo veiksmas, kai jis toje knygoje ieško konkretaus fakto ir akimirksniu gauna atsakymą.

Nors apmokymui reikalingi didžiuliai GPU klasteriai, veikiantys mėnesius, inferencija vyksta kiekvieną kartą, kai vartotojas pateikia užklausą pokalbių robotui, savivaldis automobilis priima sprendimą per dalį sekundės arba medicininis DI analizuoja skenogramą. DI persikeliant iš eksperimentinių laboratorijų į visur esančius vartotojų produktus, tikimasi, kad inferencijos užduočių apimtis kelis kartus viršys apmokymo apimtis. Iš čia ir kyla 1 trilijono dolerių vertinimas. Tai perėjimas nuo smegenų kūrimo prie smegenų valdymo pasauliniu mastu.

„Groq“ integracija: delsos problemos sprendimas

Vienas labiausiai stebinančių pranešimų GTC 2026 konferencijoje buvo gilus „Groq“ technologijos integravimas – startuolio, kurį „Nvidia“ licencijavo už 17 mlrd. dolerių praėjusių metų pabaigoje. „Groq“ išgarsėjo savo kalbos apdorojimo blokais (LPU), kurie teikia pirmenybę „deterministiniam“ našumui – iš esmės užtikrinant, kad DI atsakymai būtų pateikiami beveik be jokio vėlavimo.

Įtraukdama „Groq“ architektūrines paslaptis į savo naująjį centrinį procesorių ir DI sistemas, „Nvidia“ sprendžia pagrindinį įmonių DI skundą: delsą. Pasaulyje, kuriame pusės sekundės vėlavimas klientų aptarnavimo robote ar finansinės prekybos algoritme gali lemti prarastas pajamas, greitis yra pagrindinė valiuta. Naujasis Huang pristatytas aparatinės įrangos rinkinys žada paleisti sudėtingiausius pasaulio modelius taip sklandžiai, kad tai primintų žmogaus pokalbį, paliekant praeityje „žodis po žodžio“ mikčiojimą, būdingą ankstesnėms DI iteracijoms.

Nauja aparatinė įranga: vieninga architektūra

Jensen Huang pagrindiniame pranešime pristatė naują centrinių procesorių klasę, sukurtą specialiai dirbti kartu su licencijuota „Groq“ technologija. Tai ne tik greitesnis GPU; tai specializuota sistema lustas (SoC), skirta „realaus laiko įmonei“.

Funkcija Ankstesnė karta (H200/B200) Naujoji 2026 m. inferencijos sistema
Pagrindinis dėmesys Modelio apmokymas ir pralaidumas Realaus laiko inferencija ir delsa
Architektūra Hopper/Blackwell Vieninga LPU patobulinta architektūra
Energijos vartojimo efektyvumas Didelis suvartojimas vienam žetonui 40 % mažesnės energijos sąnaudos vienai inferencijai
Jungiamumas NVLink 4.0 Itin mažos delsos „Groq“ kilmės struktūra

Ši aparatinė įranga yra tiek gynybinis, tiek puolamasis žingsnis. Gynybiniu požiūriu ji neleidžia debesijos milžinams, tokiems kaip „Amazon“ ir „Google“, paveržti rinkos dalies su savo pritaikytais inferencijos lustais (tokiais kaip „Inferentia“ ar TPU). Puolamuoju požiūriu ji nustato naują auksinį našumo standartą, kurį konkurentams bus sunku pasiekti.

Ką tai reiškia kūrėjams ir įmonėms

Technologijų pramonei „Nvidia“ statymas už inferenciją keičia ateinančių 24 mėnesių gaires. Mes traukiamės nuo mentaliteto „didesnis yra geriau“ kalbant apie modelio dydį ir judame link eros „efektyvumas yra karalius“.

Praktinės įžvalgos verslui:

  • Optimizuokite delsą: Jei kuriate DI programas, dėmesys turėtų nukrypti nuo to, koks protingas yra modelis, į tai, kaip greitai jis atsako. Vartotojų išlaikymas 2026 m. tampa atsako greičio sinonimu.
  • Įvertinkite periferinius skaičiavimus (Edge) prieš debesiją: „Nvidia“ naujiesiems procesoriams tampant efektyvesniems, galingos inferencijos vykdymas „pakraštyje“ (vietiniuose serveriuose arba aukščiausios klasės įrenginiuose) tampa perspektyvesnis nei kiekvienos užklausos siuntimas į centrinį debesį.
  • Biudžetas plėtrai: Augant inferencijos apimčiai, kaina už užklausą tampa svarbiausiu rodikliu balanse. Naujasis „Nvidia“ dėmesys energijos vartojimo efektyvumui yra tiesioginis atsakas į tvaraus DI mastelio poreikį.

Kelias į 2027-uosius

„Nvidia“ 1 trilijono dolerių prognozė yra drąsi, tačiau ji pagrįsta realybe, kad DI tampa pagrindine skaičiavimo sąsaja. Užsitikrinusi technologiją, reikalingą dominuoti inferencijos rinkoje, „Nvidia“ bando užtikrinti, kad ji išliktų nepakeičiamu DI ekonomikos stuburu.

Kaip Jensen Huang pažymėjo baigiamajame žodyje, pirmasis DI eros trilijonas dolerių buvo išleistas mokymuisi. Kitas trilijonas bus išleistas tų žinių pritaikymui realiuoju laiku. „Nvidia“ tikslas – užtikrinti, kad kiekvieną kartą, kai DI „mąsto“, jis tai darytų naudodamas jų silicį.

Šaltiniai

  • Nvidia Official GTC 2026 Keynote Archives
  • Groq Architecture Whitepapers and Licensing Disclosures
  • Market Analysis: The Shift from Training to Inference (TechPulse Reports 2025)
  • Financial Times: Nvidia's $17 Billion Strategic Licensing Move
bg
bg
bg

Iki pasimatymo kitoje pusėje.

Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.

/ Sukurti nemokamą paskyrą