Tehisintellekt

Miks teie kohalikku tehast võib peagi juhtida „visuaalse märkmeplokiga“ varustatud robot

Google'i Gemini Robotics-ER 1.6 võimaldab Boston Dynamicsi Spotil lugeda näidikuid 98% täpsusega, tuues tööstuslikesse ülevaatustesse „agentse nägemise“.
Miks teie kohalikku tehast võib peagi juhtida „visuaalse märkmeplokiga“ varustatud robot

Kujutage ette väsimatut praktikanti, kes rändab mööda laiahaardelist tööstuskompleksi. See praktikant ei vaja kohvi, ei tüdine kunagi tuhandendat korda sama manomeetrit vahtimast ja suudab nüüd kogenud inseneri täpsusega eristada veidi lahtist polti katastroofilisest torurikkest. See ei ole stseen ulmefilmi uusversioonist; see on Google DeepMindi ja Boston Dynamicsi viimase koostöö käegakatsutav tulemus.

  1. aprillil 2026 teatas Google Gemini Robotics-ER 1.6 väljalaskmisest. Tegemist on spetsialiseeritud tehisintellekti mudeliga, mis on loodud andma neljajalgsetele robotitele, nagu Spot, „kehastunud mõtlemisvõime“ (embodied reasoning). Lihtsamalt öeldes tähendab see, et robot ei ole enam lihtsalt kaugjuhitav kaamera. See hakkab mõistma füüsilist maailma, kus ta viibib, liikudes lihtsast tööriistast autonoomseks inspektoriks, kes suudab lugeda analoognäidikuid ja tuvastada segamini ruumis tööriistu peaaegu inimese täpsusega.

„Pimeda“ roboti lõpp

Ajalooliselt on robotid olnud suurepärased korduvate tegevuste sooritamisel, kuid kehvad vaatlejad. Kui programmeerite robotkäe auto ust punktkeevitama, teeb see seda täiuslikult miljon korda. Kui aga see autouks nihkuks kaks tolli vasakule, jätkaks robot tõenäoliselt tühja õhu keevitamist. See kohanemisvõime puudumine on hoidnud robotid piiratuna rangelt kontrollitud keskkondades, nagu koosteliinid.

Selle uue värskenduse kapoti all on midagi, mida Google kutsub „agentseks nägemiseks“ (agentic vision). Mõelge sellest kui visuaalsest märkmeplokist. Kui robot vaatab keerulist stseeni — näiteks 50 erineva analoognäidikuga seina vananevas elektrijaamas —, ei tee ta lihtsalt fotot. Ta kasutab tehisintellekti mudelit, et „osutada“ konkreetsetele elementidele, käivitada väikeseid koodijuppe nähtu kontrollimiseks ja andmete põhjal järeldusi teha.

Praktiliselt on see viinud tohutu hüppeni jõudluses. Selle mudeli eelmine versioon 1.5 suutis instrumente õigesti lugeda vaid umbes 23 protsendil kordadest. Uus 1.6 mudel on tõstnud selle täpsuse vapustava 98 protsendini. Tavakasutaja jaoks on see vahe GPS-il, mis käsib teil aeg-ajalt järve sõita, ja sellisel, mis navigeerib keerulises viieharulises ristmikus ilma higistamata.

Miks analoognäidikud digitaalses maailmas ikka veel olulised on

Võib tunduda ebaloomulik kulutada miljoneid dollareid õpetamaks kõrgtehnoloogilisele robotkoerale 50 aastat vana analoogtermomeetri lugemist. Miks mitte lihtsalt asendada termomeeter digitaalse anduriga, mis saadab andmed pilve?

Suurt pilti vaadates on globaalne tööstuslik selgroog uskumatult vastupidav — ja uskumatult vana. Iga manuaalse ventiili, vaateklaasi ja manomeetri väljavahetamine rafineerimistehases või Hyundai autotehases maksaks miljardeid ja nõuaks kuude pikkust seisakuaega. Palju skaleeritavam on anda robotile „silmad“ olemasolevate seadmete lugemiseks, kui ehitada maailm ümber robotile sobivaks.

Siinkohal muutub partnerlus Boston Dynamicsiga kriitiliseks. Nende robotit Spot katsetatakse juba Hyundai Motor Groupile kuuluvates rajatistes. Kasutades Gemini Robotics-ER 1.6, suudab Spot nüüd teostada „mitmevaatist mõtlemist“. Ta saab kasutada oma erinevaid kaamerapilte, et mõista keskkonda 3D-s, tagades, et ta ei näe ainult näidikut, vaid mõistab, kus see näidik asub ülejäänud masinate suhtes.

„Hallutsinatsioonide“ probleemi lahendamine

Üks suurimaid takistusi tehisintellekti jaoks füüsilises maailmas on „hallutsinatsioonid“ — mudelite kalduvus enesekindlalt väita, et midagi on olemas, kuigi see puudub. Vestlusrobotis on hallutsinatsioon naljakas veidrus; rasketööstuses, kus robot jälgib lenduvaid kemikaale, on hallutsinatsioon ohutusõudusmäng.

Google'i testimine näitas, et 1.6 mudel püsib palju paremini reaalsuses. Testis, mis hõlmas tööriistu täis lauda, „nägi“ vanem mudel käru, mida polnud olemas, lihtsalt sellepärast, et tal paluti seda otsida. Uus mudel aga tuvastas õigesti haamrid, käärid ja tangid, ignoreerides samal ajal „trikiga“ küsimust. See parandatud täpsus on aluseks robotite toomisele laborist segasesse ja ettearvamatusse pärismaailma.

Funktsioon Gemini Robotics-ER 1.5 Gemini Robotics-ER 1.6 Gemini 3.0 Flash
Instrumentide lugemise täpsus 23% 98% 67%
Visuaalne päättlemine Põhiline Agentne (visuaalne märkmeplokk) Standardne
Ohutuspiirangud Manuaalne Integreeritud/Süsteemne Üldine
Hallutsinatsioonide määr Kõrge Madal Mõõdukas

Ohutus ennekõike: robot kui valvur

Lisaks näidikute lugemisele kirjeldatakse uut mudelit kui Google'i seni turvalisimat. Seda on treenitud mõistma füüsilisi ohutuspiiranguid, näiteks kuidas käsitseda vedelikke ilma neid maha loksutamata või kuidas navigeerida inimeste ümber.

Teisisõnu õpib tehisintellekt füüsilise maailma „terve mõistuse“ reegleid. Ta suudab nüüd tajuda vigastuste ohtu keerulistes stsenaariumides — näiteks mõista, et laps pistikupesa lähedal on kõrge riskiga olukord. Kuigi me oleme veel kaugel sellest, et robotil oleks inimese tasemel arusaam eetikast, on need sammud „kehastunud mõtlemisvõime“ suunas hädavajalikud robottehnika detsentraliseeritud tuleviku jaoks, kus masinad töötavad meie kõrval, mitte turvapiirde taga.

Mida see teie jaoks tähendab

Tarbija vaatepunktist ei hakka Spot-koer tõenäoliselt niipea teie kodu termostaati lugema. Kuid kaudsed mõjud on märkimisväärsed.

  1. Madalamad kulud, vähem tõrkeid: Kuna tööstusrajatised muutuvad tõhusamaks ja vähem vastuvõtlikuks inimlikele eksimustele või seadmete riketele, muutub kaupade — autodest elektrini — tootmiskulu stabiilsemaks.
  2. Nägemise demokratiseerimine: Siin välja töötatud „agentse nägemise“ tehnoloogia jõuab lõpuks ka tarbijaseadmetesse. Kujutage ette nutitelefoni rakendust, mis ei tee lihtsalt fotot teie elektrikilbist, vaid ütleb teile täpselt, milline lüliti on väljas ja miks.
  3. Ohutusstandardid: Me näeme tehisintellekti uue ohutusraamistiku sündi. Kui need mudelid õpivad austama füüsilisi piire, loovad nad aluse arenenumatele koduabilistele ja kullerrobotitele, kelle läheduses on tõeliselt turvaline viibida.

Lõppkokkuvõttes ei ole küsimus ainult termomeetrit vaatavas robotkoeras. See on digitaalse intelligentsuse ja füüsilise kohalolu ühinemine. Me liigume maailma poole, kus andmete „digitaalset toornaftat“ ammutavad ja rafineerivad masinad, mis suudavad lõpuks näha maailma sama selgelt kui meie.

Oma päeva jooksul leidke hetk, et vaadata nähtamatut tööstusmehaanikat teie ümber — torusid keldris, mõõdikuid maja seinal, keerulisi masinaid toidupoe tagaosas. Aastakümneid on need vajanud turvalisuse tagamiseks inimese silmapaari. Oleme nüüd astumas ajastusse, kus need silmad ei pilgu kunagi, ei väsi ja — tänu visuaalsele märkmeplokile — eksivad harva.

bg
bg
bg

Kohtumiseni teisel poolel.

Meie läbivalt krüpteeritud e-posti ja pilvesalvestuse lahendus pakub kõige võimsamaid vahendeid turvaliseks andmevahetuseks, tagades teie andmete turvalisuse ja privaatsuse.

/ Tasuta konto loomin