Įsivaizduokite nepavargstantį praktikantą, klaidžiojantį po didžiulį pramoninį kompleksą. Šiam praktikantui nereikia kavos, jam niekada nenusibosta tūkstantąjį kartą žiūrėti į tą patį manometrą, o dabar jis gali atskirti šiek tiek atsilaisvinusį varžtą nuo katastrofiško vamzdžio gedimo su patyrusio inžinieriaus tikslumu. Tai nėra scena iš mokslinės fantastikos filmo perdirbinio; tai apčiuopiamas naujausio „Google DeepMind“ ir „Boston Dynamics“ bendradarbiavimo rezultatas.
2026 m. balandžio 14 d. „Google“ paskelbė apie „Gemini Robotics-ER 1.6“ išleidimą – specializuotą DI modelį, skirtą suteikti tokiems robotams kaip keturkojis „Spot“ „įkūnytą mąstymą“ (angl. embodied reasoning). Paprastai tariant, tai reiškia, kad robotas nebėra tik nuotoliniu būdu valdoma kamera. Jis pradeda suprasti fizinį pasaulį, kuriame gyvena, iš paprasto įrankio tapdamas autonominiu inspektoriumi, gebančiu skaityti analoginius ciferblatus ir atpažinti įrankius netvarkingoje patalpoje beveik žmogaus tikslumu.
Istoriškai robotai puikiai atlikdavo pasikartojančius veiksmus, tačiau buvo prasti stebėtojai. Jei užprogramuotumėte roboto ranką taškiniu būdu suvirinti automobilio dureles, jis tai padarytų tobulai milijoną kartų. Tačiau jei tos durelės būtų pastumtos penkis centimetrus į kairę, robotas greičiausiai toliau virintų orą. Šis prisitaikymo trūkumas neleido robotams išeiti už griežtai kontroliuojamos aplinkos, pavyzdžiui, surinkimo linijų, ribų.
Šio naujo atnaujinimo pagrindas yra tai, ką „Google“ vadina „agentiškuoju matymu“ (angl. agentic vision). Įsivaizduokite tai kaip vizualųjį juodraštį. Kai robotas žiūri į sudėtingą sceną – tarkime, 50 skirtingų analoginių matuoklių sieną senstančioje jėgainėje – jis ne tiesiog nufotografuoja. Jis naudoja DI modelį, kad „parodytų“ į konkrečius elementus, vykdytų nedideles kodo ištraukas tam, ką mato, patikrinti ir analizuotų duomenis.
Praktiškai tai lėmė milžinišką našumo šuolį. Ankstesnė šio modelio versija (1.5) teisingai nuskaityti prietaisus gebėjo tik apie 23 proc. atvejų. Naujasis 1.6 modelis šį tikslumą padidino iki stulbinančių 98 proc. Vidutiniam vartotojui tai yra skirtumas tarp GPS, kuris retkarčiais liepia įvažiuoti į ežerą, ir tokio, kuris be vargo įveikia sudėtingą penkių krypčių sankryžą.
Gali atrodyti nelogiška leisti milijonus dolerių mokant aukštųjų technologijų robotą-šunį skaityti 50 metų senumo analoginį termometrą. Kodėl tiesiog nepakeitus termometro skaitmeniniu jutikliu, siunčiančiu duomenis į debesį?
Žvelgiant į platesnį vaizdą, pasaulinis pramonės stuburas yra neįtikėtinai atsparus ir neįtikėtinai senas. Pakeisti kiekvieną rankinį vožtuvą, stebėjimo stiklą ir manometrą naftos perdirbimo gamykloje ar „Hyundai“ automobilių gamykloje kainuotų milijardus ir pareikalautų mėnesių prastovos. Kur kas lengviau pritaikoma suteikti robotui „akis“, kad jis galėtų skaityti esamą įrangą, nei perstatyti pasaulį taip, kad jis tiktų robotui.
Čia partnerystė su „Boston Dynamics“ tampa itin svarbi. Jų robotas „Spot“ jau išbandomas „Hyundai Motor Group“ priklausančiose gamyklose. Naudodamas „Gemini Robotics-ER 1.6“, „Spot“ dabar gali atlikti „daugiakryptį mąstymą“. Jis gali naudoti įvairius savo kamerų srautus, kad suprastų aplinką 3D formatu, užtikrindamas, kad jis ne tik mato matuoklį, bet ir supranta, kur tas matuoklis yra kitų mechanizmų atžvilgiu.
Viena didžiausių kliūčių DI fiziniame pasaulyje yra „haliucinacijos“ – modelių tendencija užtikrintai teigti, kad kažkas yra, kai to nėra. Pokalbių robote haliucinacija yra juokingas nesusipratimas; sunkiosios pramonės aplinkoje, kur robotas stebi lakiąsias chemines medžiagas, haliucinacija yra saugumo košmaras.
„Google“ bandymai parodė, kad 1.6 modelis kur kas geriau išlieka realybėje. Atliekant testą su įrankiais užkrautu stalu, senesnis modelis „pamatė“ karutį, kurio nebuvo, vien todėl, kad jo paprašė tokio paieškoti. Naujasis modelis, priešingai, teisingai atpažino plaktukus, žirkles ir replės, ignoruodamas „apgaulingą“ klausimą. Šis padidintas tikslumas yra pagrindas perkeliant robotus iš laboratorijų į netvarkingą, nenuspėjamą realų pasaulį.
| Funkcija | Gemini Robotics-ER 1.5 | Gemini Robotics-ER 1.6 | Gemini 3.0 Flash |
|---|---|---|---|
| Prietaisų nuskaitymo tikslumas | 23% | 98% | 67% |
| Vizualinis mąstymas | Bazinis | Agentiškas (Vizualusis juodraštis) | Standartinis |
| Saugos apribojimai | Rankiniai | Integruoti/Sisteminiai | Bendrieji |
| Haliucinacijų dažnis | Aukštas | Žemas | Vidutinis |
Be matuoklių skaitymo, naujasis modelis apibūdinamas kaip saugiausias iki šiol sukurtas „Google“ modelis. Jis buvo apmokytas suprasti fizinės saugos apribojimus, pavyzdžiui, kaip elgtis su skysčiais jų neišlaistant arba kaip judėti aplink žmones.
Kitaip tariant, DI mokosi fizinio pasaulio „sveiko proto“ taisyklių. Dabar jis gali suvokti sužalojimo riziką sudėtingais scenarijais – pavyzdžiui, atpažinti, kad vaikas šalia elektros lizdo yra didelės rizikos situacija. Nors mums dar toli iki roboto, turinčio žmogaus lygio etikos supratimą, šie nedideli žingsniai link „įkūnyto mąstymo“ yra būtini decentralizuotai robotikos ateičiai, kurioje mašinos dirbs kartu su mumis, o ne už apsauginės tvoros.
Vartotojo požiūriu, tikėtina, kad artimiausiu metu neturėsite „Spot“ šuns, nuskaitančio jūsų namų termostatą. Tačiau šalutinis poveikis yra reikšmingas.
Galiausiai, tai ne tik apie robotą-šunį, žiūrintį į termometrą. Tai apie skaitmeninio intelekto susiliejimą su fiziniu buvimu. Judame link pasaulio, kuriame duomenų „skaitmeninę žalią naftą“ išgauna ir apdirba mašinos, kurios pagaliau gali matyti pasaulį taip pat aiškiai kaip ir mes.
Leisdami savo dieną, akimirką pažvelkite į nematomą pramoninę mechaniką aplink jus – vamzdžius rūsyje, skaitiklius namo šone, sudėtingą įrangą maisto prekių parduotuvės gale. Dešimtmečius jiems reikėjo žmogaus akių poros, kad būtų užtikrintas saugumas. Dabar žengiame į erą, kai tos akys niekada nemirksi, niekada nepavargsta ir – vizualiojo juodraščio dėka – retai klysta.



Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.
/ Sukurti nemokamą paskyrą