Lielākā daļa tehnoloģiju ziņu virsrakstu liecina, ka roboti tūlīt, tūlīt locīs jūsu veļu un vedīs pastaigā suni. Realitātē robots mūsdienīgā rūpnīcā bieži vien prasa inženieru komandas darbu, lai ieprogrammētu katru tā kustības centimetru. Ja kaste uz konveijera lentes novietota nedaudz šķībi, visa sistēma var apstāties. Fiziskā pasaule ir nekārtīga, neparedzama un programmatūrai grūti pārvaldāma. Kamēr digitālais MI var sarakstīt dzejoli dažu sekunžu laikā, fiziskais MI ir pūlējies saprast, kā bumba atlec vai kā saplīst stikls.
NVIDIA ir laidusi klajā Cosmos 3, lai novērstu tieši šo plaisu. Uzņēmums to sauc par atvērtās pasaules pamata modeli fiziskajam MI. Šī sistēma atšķiras no tērzēšanas robotiem, kurus daudzi cilvēki izmanto šodien. Tā ir digitālā nervu sistēma, kas izstrādāta, lai palīdzētu mašīnām uztvert fizisko pasauli un paredzēt, kas notiks tālāk. Raugoties plašākā mērogā, šis izlaidums ir solis, lai pārvietotu MI no mūsu datoru ekrāniem uz smago rūpniecību, kas veido mūsdienu dzīves neredzamo mugurkaulu.
Zem pārsega Cosmos 3 izmanto "mixture-of-transformers" arhitektūru. Tas izklausās sarežģīti, taču būtībā tas piešķir MI divus dažādus domāšanas spēka veidus. Pirmā daļa ir spriešanas transformators (reasoning transformer). Domājiet par to kā par navigatoru automašīnā, kurš skatās kartē un izlemj labāko maršrutu. Tas apstrādā vizuālo informāciju un telpiskās attiecības, lai izprastu vidi. Otrā daļa ir ekspertu ģenerēšanas transformators (expert generation transformer). Šis ir vadītājs, kurš precīzi zina, cik daudz pagriezt stūri un kad nospiest bremzes.
Savienojot šīs divas struktūras, modelis izprot objektu mijiedarbību un kustību, pirms tas mēģina rīkoties. Agrāk roboti bieži paļāvās uz fiksētiem skriptiem. Tie nesaprata, kāpēc tie pārvietojas noteiktā veidā. Cosmos 3 izmanto to, ko NVIDIA sauc par vadošo fizikas precizitāti, lai prognozētu trajektorijas. Ja robotam ir jāpaceļ slidens objekts, modelis palīdz tam saprast, kā berze un gravitācija ietekmēs uzdevumu.
Lielākā daļa cilvēku pārzina valodas modeļus, kas apstrādā tekstu. Cosmos 3 ir omnimodelis, kas nozīmē, ka tas vienlaikus apstrādā dažāda veida datus. Tas saprot tekstu, attēlus, video un apkārtējo skaņu. Tas ir racionalizēts veids, kā izveidot mašīnu, kas patiešām var izdzīvot cilvēku vidē. Robotam noliktavā vienlaikus ir jāredz braucošs iekrāvējs, jādzird tā brīdinājuma signāls un jāsaprot ekrānā redzamā teksta instrukcija.
Šis modelis arī pats ģenerē savus datus. Tas ir praktisks risinājums lielai problēmai robotikā. Ir ļoti dārgi un lēni filmēt tūkstošiem stundu, kā robotiem neizdodas kaut ko paveikt reālajā pasaulē, lai iemācītu tiem, ko nedarīt. Cosmos 3 izveido sintētiskos datus jeb digitālās prakses sesijas, kurās roboti var kļūdīties miljoniem reižu simulācijā, pirms tie vispār pieskaras aparatūrai. Tas samazina nepieciešamību pēc milzīgām reālās pasaules apmācības datu kopām un ļauj paātrināt izstrādi.
McKinsey nozares pētnieki pieļauj, ka robotika drīz pārvarēs plaisu starp simulāciju un realitāti. Vēsturiski roboti strādāja nožogojumos pie montāžas līnijām, lai neapdraudētu cilvēkus. Šodien tie darbojas dinamiskā vidē, kur tiem jāpielāgojas kustīgiem cilvēkiem un mainīgiem objektiem. Tam nepieciešama autonomija, ko vecāka programmatūra nespēja nodrošināt.
| Funkcija | Tradicionālā robotikas programmatūra | NVIDIA Cosmos 3 fiziskais MI |
|---|---|---|
| Vide | Kontrolēti, statiski nožogojumi | Dinamiskas, neparedzamas telpas |
| Apmācības dati | Manuāli kodēti skripti | Sintētiskie dati un redzes modeļi |
| Reakcija uz izmaiņām | Bieži neizdodas, ja detaļa tiek pārvietota | Paredz fiziku, lai pielāgotos darba gaitā |
| Ievades veidi | Ierobežoti sensoru dati | Video, skaņas, teksta un telpiskie dati |
| Aparatūra | Vienmērķa iekārtas | Universāli fiziskā MI aģenti |
Deloitte prognozē, ka globālā uzstādītā rūpniecisko robotu jauda līdz 2026. gadam sasniegs 5,5 miljonus. Šī izaugsme ir atkarīga no tā, vai mašīnas kļūs intuitīvākas. Ja robotam ir tāds pamata modelis kā Cosmos 3, tas nav jāpārprogrammē katram jaunam uzdevumam. Tam ir vispārēja izpratne par to, kā darbojas pasaule.
NVIDIA netur šo tehnoloģiju aiz slēgtām durvīm. Uzņēmums izveidoja Cosmos koalīciju, kurā ietilpst izstrādātāji un pasaules modeļu veidotāji, piemēram, Black Forest Labs un Runway. Tā ir decentralizēta pieeja izstrādei. Padarot modeli atvērtu, NVIDIA ļauj citiem uzņēmumiem sniegt savu ieguldījumu ar pētījumiem un datiem.
Vidējam lietotājam tas nozīmē, ka dažādu zīmolu roboti vai autonomās automašīnas var koplietot kopīgu valodu fizikas izpratnei. Lielākie elektronikas uzņēmumi, piemēram, Samsung un LG, jau izmanto šo platformu. Automobiļu nozarē Li Auto to izmanto autonomo transportlīdzekļu izstrādei. Kad šie uzņēmumi strādā pie viena un tā paša pamata modeļa, tehnoloģija uzlabojas ātrāk visiem.
Viena no visvairāk transformējošajām šī paziņojuma daļām ir fokuss uz neironu ainu rekonstrukciju un video papildināšanu. Būtībā šie rīki ļauj izstrādātājam paņemt vienu noliktavas video un pārvērst to tūkstošos dažādu scenāriju. Viņi var mainīt apgaismojumu, pievienot šķēršļus vai simulēt aprīkojuma kļūmi.
Tas ir taustāms progress, jo tas atrisina datu trūkuma problēmu. Ir daudz vieglāk iemācīt pašbraucošai automašīnai rīkoties retā sniegputenī, ja varat ģenerēt kvalitatīvu, fiziski precīzu šī sniegputeņa simulāciju. Patērētājam tas nozīmē produktus, kas ir izturīgāki un drošāki. Piegādes robots, kas izmanto šīs prasmes, mazāk ticams, ka apmulsīs no peļķes uz ietves vai klaiņojoša suņa, jo tas jau ir redzējis tūkstošiem šo šķēršļu variāciju savā digitālajā apmācībā.
Galu galā jūs, iespējams, nekad neredzēsiet Cosmos 3 programmatūru tieši, taču jūs izjutīsiet tās ietekmi. Šī tehnoloģija ir pamata slānis nākamās paaudzes patēriņa precēm un pakalpojumiem. No tirgus viedokļa šīs pārmaiņas varētu novest pie pieejamākiem produktiem, jo viedās rūpnīcas kļūs efektīvākas.
Ko tas nozīmē jums:
Džensens Huans (Jensen Huang), NVIDIA dibinātājs, raksturo to kā fiziskā MI "Lielo sprādzienu". Lai gan tā ir korporatīvā valoda, pamatā esošās pārmaiņas ir reālas. Mēs pārejam no MI, kas tikai runā, uz MI, kas dara. Cosmos 3 Super izlaidums nodrošina augstāko fizikas precizitātes līmeni lietojumprogrammām, kuras nevar atļauties kļūdas, piemēram, smagajai tehnikai vai autonomajam tranzītam.
No patērētāja viedokļa mēs ieejam periodā, kad mašīnas ap mums sāks šķist mazāk kā ieprogrammēti rīki un vairāk kā apzinīgi asistenti. Tās uztvers, spriedīs un rīkosies ar tādu plūstamību, kas kādreiz bija raksturīga tikai zinātniskajai fantastikai. Tā kā šie modeļi kļūs arvien izplatītāki, robeža starp digitālo un fizisko pasauli turpinās izzust.
Tā vietā, lai gaidītu vienu revolucionāru robotu, kas mainīs pasauli, mēs redzam universālu smadzeņu ierašanos, kuras var uzstādīt daudzos dažādos mašīnu veidos. Šīs sistēmiskās izmaiņas, visticamāk, pārveidos to, kā mēs mijiedarbojamies ar tehnoloģijām savās mājās, birojos un pilsētās. Pievērsiet uzmanību nākamreiz, kad redzēsiet pašapkalpošanās kasi vai automatizētus piegādes ratiņus. Šīs ierīces pārtop no vienkāršiem datoriem par fiziskā MI aģentiem, kas patiesi saprot pasauli, kurā tie atrodas.
Avoti: NVIDIA Corporate Newsroom, McKinsey Global Institute, Deloitte Industrial Outlook 2026.



Mūsu end-to-end šifrētais e-pasta un mākoņdatu glabāšanas risinājums nodrošina visefektīvākos līdzekļus drošai datu apmaiņai, garantējot jūsu datu drošību un konfidencialitāti.
/ Izveidot bezmaksas kontu