Kujutage ette väsimatut praktikanti, kes rändab mööda laiahaardelist tööstuskompleksi. See praktikant ei vaja kohvi, ei tüdine kunagi tuhandendat korda sama manomeetrit vahtimast ja suudab nüüd kogenud inseneri täpsusega eristada veidi lahtist polti katastroofilisest torurikkest. See ei ole stseen ulmefilmi uusversioonist; see on Google DeepMindi ja Boston Dynamicsi viimase koostöö käegakatsutav tulemus.
Ajalooliselt on robotid olnud suurepärased korduvate tegevuste sooritamisel, kuid kehvad vaatlejad. Kui programmeerite robotkäe auto ust punktkeevitama, teeb see seda täiuslikult miljon korda. Kui aga see autouks nihkuks kaks tolli vasakule, jätkaks robot tõenäoliselt tühja õhu keevitamist. See kohanemisvõime puudumine on hoidnud robotid piiratuna rangelt kontrollitud keskkondades, nagu koosteliinid.
Selle uue värskenduse kapoti all on midagi, mida Google kutsub „agentseks nägemiseks“ (agentic vision). Mõelge sellest kui visuaalsest märkmeplokist. Kui robot vaatab keerulist stseeni — näiteks 50 erineva analoognäidikuga seina vananevas elektrijaamas —, ei tee ta lihtsalt fotot. Ta kasutab tehisintellekti mudelit, et „osutada“ konkreetsetele elementidele, käivitada väikeseid koodijuppe nähtu kontrollimiseks ja andmete põhjal järeldusi teha.
Praktiliselt on see viinud tohutu hüppeni jõudluses. Selle mudeli eelmine versioon 1.5 suutis instrumente õigesti lugeda vaid umbes 23 protsendil kordadest. Uus 1.6 mudel on tõstnud selle täpsuse vapustava 98 protsendini. Tavakasutaja jaoks on see vahe GPS-il, mis käsib teil aeg-ajalt järve sõita, ja sellisel, mis navigeerib keerulises viieharulises ristmikus ilma higistamata.
Võib tunduda ebaloomulik kulutada miljoneid dollareid õpetamaks kõrgtehnoloogilisele robotkoerale 50 aastat vana analoogtermomeetri lugemist. Miks mitte lihtsalt asendada termomeeter digitaalse anduriga, mis saadab andmed pilve?
Suurt pilti vaadates on globaalne tööstuslik selgroog uskumatult vastupidav — ja uskumatult vana. Iga manuaalse ventiili, vaateklaasi ja manomeetri väljavahetamine rafineerimistehases või Hyundai autotehases maksaks miljardeid ja nõuaks kuude pikkust seisakuaega. Palju skaleeritavam on anda robotile „silmad“ olemasolevate seadmete lugemiseks, kui ehitada maailm ümber robotile sobivaks.
Siinkohal muutub partnerlus Boston Dynamicsiga kriitiliseks. Nende robotit Spot katsetatakse juba Hyundai Motor Groupile kuuluvates rajatistes. Kasutades Gemini Robotics-ER 1.6, suudab Spot nüüd teostada „mitmevaatist mõtlemist“. Ta saab kasutada oma erinevaid kaamerapilte, et mõista keskkonda 3D-s, tagades, et ta ei näe ainult näidikut, vaid mõistab, kus see näidik asub ülejäänud masinate suhtes.
Üks suurimaid takistusi tehisintellekti jaoks füüsilises maailmas on „hallutsinatsioonid“ — mudelite kalduvus enesekindlalt väita, et midagi on olemas, kuigi see puudub. Vestlusrobotis on hallutsinatsioon naljakas veidrus; rasketööstuses, kus robot jälgib lenduvaid kemikaale, on hallutsinatsioon ohutusõudusmäng.
Google'i testimine näitas, et 1.6 mudel püsib palju paremini reaalsuses. Testis, mis hõlmas tööriistu täis lauda, „nägi“ vanem mudel käru, mida polnud olemas, lihtsalt sellepärast, et tal paluti seda otsida. Uus mudel aga tuvastas õigesti haamrid, käärid ja tangid, ignoreerides samal ajal „trikiga“ küsimust. See parandatud täpsus on aluseks robotite toomisele laborist segasesse ja ettearvamatusse pärismaailma.
| Funktsioon | Gemini Robotics-ER 1.5 | Gemini Robotics-ER 1.6 | Gemini 3.0 Flash |
|---|---|---|---|
| Instrumentide lugemise täpsus | 23% | 98% | 67% |
| Visuaalne päättlemine | Põhiline | Agentne (visuaalne märkmeplokk) | Standardne |
| Ohutuspiirangud | Manuaalne | Integreeritud/Süsteemne | Üldine |
| Hallutsinatsioonide määr | Kõrge | Madal | Mõõdukas |
Lisaks näidikute lugemisele kirjeldatakse uut mudelit kui Google'i seni turvalisimat. Seda on treenitud mõistma füüsilisi ohutuspiiranguid, näiteks kuidas käsitseda vedelikke ilma neid maha loksutamata või kuidas navigeerida inimeste ümber.
Teisisõnu õpib tehisintellekt füüsilise maailma „terve mõistuse“ reegleid. Ta suudab nüüd tajuda vigastuste ohtu keerulistes stsenaariumides — näiteks mõista, et laps pistikupesa lähedal on kõrge riskiga olukord. Kuigi me oleme veel kaugel sellest, et robotil oleks inimese tasemel arusaam eetikast, on need sammud „kehastunud mõtlemisvõime“ suunas hädavajalikud robottehnika detsentraliseeritud tuleviku jaoks, kus masinad töötavad meie kõrval, mitte turvapiirde taga.
Tarbija vaatepunktist ei hakka Spot-koer tõenäoliselt niipea teie kodu termostaati lugema. Kuid kaudsed mõjud on märkimisväärsed.
Lõppkokkuvõttes ei ole küsimus ainult termomeetrit vaatavas robotkoeras. See on digitaalse intelligentsuse ja füüsilise kohalolu ühinemine. Me liigume maailma poole, kus andmete „digitaalset toornaftat“ ammutavad ja rafineerivad masinad, mis suudavad lõpuks näha maailma sama selgelt kui meie.
Oma päeva jooksul leidke hetk, et vaadata nähtamatut tööstusmehaanikat teie ümber — torusid keldris, mõõdikuid maja seinal, keerulisi masinaid toidupoe tagaosas. Aastakümneid on need vajanud turvalisuse tagamiseks inimese silmapaari. Oleme nüüd astumas ajastusse, kus need silmad ei pilgu kunagi, ei väsi ja — tänu visuaalsele märkmeplokile — eksivad harva.



Meie läbivalt krüpteeritud e-posti ja pilvesalvestuse lahendus pakub kõige võimsamaid vahendeid turvaliseks andmevahetuseks, tagades teie andmete turvalisuse ja privaatsuse.
/ Tasuta konto loomin