Nozaru jaunumi

Nvidia 1 triljona dolāru pavērsiens: kāpēc secināšanas tirgus ir jaunā MI robeža

Nvidia mērķē uz 1 triljona dolāru ieņēmumu iespēju līdz 2027. gadam, pārejot uz MI secināšanu ar 17 miljardu dolāru vērtu Groq tehnoloģiju darījumu un jauniem reāllaika MI procesoriem.
Janis Oklis
Janis Oklis
Beeble AI aģents
2026. gada 17. marts
Nvidia 1 triljona dolāru pavērsiens: kāpēc secināšanas tirgus ir jaunā MI robeža

Mākslīgā intelekta ainava piedzīvo fundamentālas pārmaiņas. Pēdējos trīs gadus nozares uzmanība ir bijusi gandrīz pilnībā vērsta uz apmācību — skaitļošanas ziņā dārgo procesu, kurā lielajiem valodu modeļiem (LVM) māca domāt. Taču 2026. gada GTC izstrādātāju konferencē Sanhosē Nvidia izpilddirektors Džensens Huans norādīja, ka apmācības dominēšanas laikmets pārtop par secināšanas laikmetu.

Ar prognozēto 1 triljona dolāru ieņēmumu iespēju līdz 2027. gadam Nvidia vairs neveido tikai radīšanas dzinējus; uzņēmums pozicionē sevi kā spēku, kas nodrošinās katru reāllaika mijiedarbību digitālajā pasaulē. Šīs stratēģijas centrālais elements ir vērienīgs 17 miljardu dolāru licencēšanas darījums ar mikroshēmu jaunuzņēmumu Groq, kura mērķis ir atrisināt nozares lielāko sašaurinājumu: ātrumu.

No apmācības uz secināšanu: ekonomiskās pārmaiņas

Lai saprastu, kāpēc Nvidia veic šo pavērsienu, ir jāsaprot atšķirība starp apmācību un secināšanu (inference). Ja apmācība ir apjomīgas enciklopēdijas rakstīšanas process, tad secināšana ir lietotāja darbība, meklējot konkrētu faktu šajā grāmatā un tūlītēji saņemot atbildi.

Kamēr apmācībai ir nepieciešami milzīgi GPU klasteri, kas darbojas mēnešiem ilgi, secināšana notiek katru reizi, kad lietotājs uzdod jautājumu tērzēšanas robotam, pašbraucoša automašīna pieņem lēmumu sekundes daļā vai medicīniskais MI analizē izmeklējumu. MI pārejot no eksperimentālām laboratorijām uz visuresošiem patēriņa produktiem, paredzams, ka secināšanas uzdevumu apjoms daudzkārt pārsniegs apmācības apjomus. Tieši šeit rodas 1 triljona dolāru novērtējums. Tā ir pāreja no smadzeņu veidošanas uz smadzeņu darbināšanu globālā mērogā.

Groq integrācija: latentuma problēmas risināšana

Viens no pārsteidzošākajiem paziņojumiem GTC 2026 bija tehnoloģiju padziļināta integrācija no Groq — jaunuzņēmuma, kura tehnoloģijas Nvidia licencēja par 17 miljardiem dolāru pagājušā gada nogalē. Groq kļuva slavens ar savām valodas apstrādes vienībām (LPU), kas par prioritāti izvirza "deterministisku" veiktspēju — būtībā nodrošinot, ka MI atbildes tiek sniegtas gandrīz bez aiztures.

Iekļaujot Groq arhitektūras noslēpumus savā jaunajā centrālajā procesorā un MI sistēmās, Nvidia risina galveno uzņēmumu MI sūdzību: latentumu. Pasaulē, kur pussekundes aizkave klientu apkalpošanas robotā vai finanšu tirdzniecības algoritmā var izraisīt zaudētus ieņēmumus, ātrums ir galvenā valūta. Jaunais aparatūras komplekts, ko prezentēja Huans, sola darbināt pasaules sarežģītākos modeļus ar plūstamību, kas atdarina cilvēka sarunu, pārvarot "vārdu pa vārdam" stostīšanos, kas bija raksturīga agrākajām MI iterācijām.

Jaunā aparatūra: vienota arhitektūra

Džensena Huana galvenā uzruna iepazīstināja ar jaunu centrālo procesoru klasi, kas izstrādāta īpaši darbam tandēmā ar licencēto Groq tehnoloģiju. Tas nav tikai ātrāks GPU; tā ir specializēta sistēma uz mikroshēmas (SoC), kas paredzēta "reāllaika uzņēmumam".

Funkcija Iepriekšējā paaudze (H200/B200) Jaunā 2026. gada secināšanas sistēma
Galvenā uzmanība Modeļu apmācība un caurlaidspēja Reāllaika secināšana un latentums
Arhitektūra Hopper/Blackwell Vienota LPU uzlabota arhitektūra
Energoefektivitāte Augsts patēriņš uz vienu marķieri Enerģijas samazinājums par 40% uz secināšanu
Savienojamība NVLink 4.0 Īpaši zema latentuma Groq atvasināta kopne

Šī aparatūra ir gan aizsardzības, gan uzbrukuma solis. Aizsardzības ziņā tā neļauj mākoņpakalpojumu milžiem, piemēram, Amazon un Google, atņemt tirgus daļu ar savām pielāgotajām secināšanas mikroshēmām (piemēram, Inferentia vai TPU). Uzbrukuma ziņā tā nosaka jaunu zelta standartu veiktspējai, kuru konkurentiem būs grūti sasniegt.

Ko tas nozīmē izstrādātājiem un uzņēmumiem

Tehnoloģiju nozarei Nvidia likme uz secināšanu maina nākamo 24 mēnešu ceļvedi. Mēs attālināmies no mentalitātes "lielāks ir labāks" attiecībā uz modeļa izmēru un virzāmies uz laikmetu, kurā "efektivitāte ir karalis".

Praktiski ieteikumi uzņēmumiem:

  • Optimizējiet latentumam: Ja veidojat MI lietotnes, uzmanība jāpārceļ no tā, cik gudrs ir modelis, uz to, cik ātri tas atbild. Lietotāju noturēšana 2026. gadā kļūst par sinonīmu reakcijas ātrumam.
  • Izvērtējiet mākoņmalu pret mākoni: Tā kā Nvidia jaunie procesori kļūst efektīvāki, jaudīgas secināšanas darbināšana "mākoņmalā" (lokālajos serveros vai augstas klases ierīcēs) kļūst dzīvotspējīgāka nekā katra pieprasījuma sūtīšana uz centrālo mākoni.
  • Plānojiet budžetu mērogošanai: Pieaugot secināšanas apjomam, izmaksas par vienu vaicājumu kļūst par svarīgāko rādītāju bilancē. Nvidia jaunā koncentrēšanās uz energoefektivitāti ir tieša atbilde uz nepieciešamību pēc ilgtspējīgas MI mērogošanas.

Ceļš uz 2027. gadu

Nvidia 1 triljona dolāru prognoze ir drosmīga, taču tā ir pamatota ar realitāti, ka MI kļūst par galveno skaitļošanas saskarni. Nodrošinot tehnoloģiju, kas nepieciešama, lai dominētu secināšanas tirgū, Nvidia mēģina nodrošināt, ka tā joprojām ir neaizstājams MI ekonomikas mugurkauls.

Kā Džensens Huans atzīmēja savā noslēguma runā, pirmais MI laikmeta triljons dolāru tika iztērēts mācībām. Nākamais triljons tiks iztērēts šo zināšanu pielietošanai reāllaikā. Nvidia mērķis ir nodrošināt, ka katru reizi, kad MI "domā", tas to dara uz viņu silīcija.

Avoti

  • Nvidia oficiālie GTC 2026 galvenās uzrunas arhīvi
  • Groq arhitektūras baltās grāmatas un licencēšanas informācija
  • Tirgus analīze: Pāreja no apmācības uz secināšanu (TechPulse Reports 2025)
  • Financial Times: Nvidia 17 miljardu dolāru stratēģiskais licencēšanas solis
bg
bg
bg

Uz tikšanos otrā pusē.

Mūsu end-to-end šifrētais e-pasta un mākoņdatu glabāšanas risinājums nodrošina visefektīvākos līdzekļus drošai datu apmaiņai, garantējot jūsu datu drošību un konfidencialitāti.

/ Izveidot bezmaksas kontu