Ar kada nors bandėte išmokti naujų įgūdžių – pavyzdžiui, sugroti sudėtingą fortepijono melodiją ar įvaldyti tobulą litavimo techniką – tik tam, kad suprastumėte, jog jūsų rankos tiesiog neklauso smegenų? Mes dažnai galvojame apie savo judesius kaip apie uždarą kilpą tarp mūsų ketinimų ir motorinės žievės. Bet kas, jei į tą kilpą galėtume pakviesti trečiąją šalį? Tiksliau, kas būtų, jei dirbtinis intelektas (DI) galėtų stebėti pasaulį, suprasti, ką bandote daryti, ir tiesiogine prasme tampyti jūsų raumenų stygas, kad tai įvyktų?
Tai nėra scena iš kiberpanko trilerio; tai 48 valandų sprinto Masačusetso technologijos institute (MIT) rezultatas. Per neseniai vykusį „Hard Mode 2026“ hakatoną programinės įrangos inžinerijos studentų komanda pristatė projektą pavadinimu „Human Operator“. Sujungę aukščiausios klasės vaizdo modelius su technine įranga, kuri siunčia elektros impulsus tiesiai į dėvėtojo ranką, jie efektyviai suteikė DI būdą „pilotuoti“ žmogaus kūną.
Norėdami suprasti šio pasiekimo reikšmę, pirmiausia turime pažvelgti į dabartinę DI būklę. Pastaruosius kelerius metus DI buvo tarsi smegenys be kūno – nenuilstantis praktikantas, gebantis rašyti el. laiškus, kurti vaizdus ar analizuoti milžiniškas skaičiuokles, tačiau įkalintas už stiklinio ekrano. Kol robotikos įmonės sunkiai dirba kurdamos metalinius kūnus šioms smegenims, „Human Operator“ komanda pasirinko kitą kelią: jie nusprendė panaudoti kūnus, kuriuos jau turime.
Šios sistemos pagrindas yra vaizdo ir kalbos modelis (angl. Vision-Language Model, VLM). Jei standartinis DI yra tarsi tekstinė paieškos sistema, VLM labiau primena skaitmeninį stebėtoją, kuris gali matyti objektą – tarkime, fortepijono klaviatūrą – ir suprasti, kas tai yra bei kaip žmogus turėtų su juo sąveikauti. Naudotojas dėvi ant galvos tvirtinamą kamerą, kuri veikia kaip DI akys. Kai duodate žodinę komandą, pavyzdžiui, „sugrok Do mažoro akordą“, DI ne tik pasako, kaip tai padaryti; jis apskaičiuoja tikslius tam reikalingus raumenų judesius.
Už techninio žargono slypinti techninė įranga remiasi elektrine raumenų stimuliacija (EMS). Ši technologija nėra nauja; dešimtmečius ji buvo fizinės terapijos pagrindas, naudojamas raumenų atrofijai išvengti arba reabilitacijai palengvinti. Tačiau prijungę EMS prie VLM, studentai sukūrė tiltą tarp skaitmeninio ketinimo ir fizinio veiksmo. Sistema siunčia mažus, tikslius elektros impulsus į padelius ant naudotojo dilbio, priversdama konkrečius raumenis susitraukti ir judinti pirštus be sąmoningo naudotojo sprendimo.
Demonstracijose, kurios atrodo ir įspūdingai, ir šiek tiek šiurpiai, buvo rodoma, kaip „Human Operator“ įrenginys kreipia naudotojo ranką atlikti „OK“ gestą, pamojuoti praeiviui ir net paspausti konkrečias natas fortepijonu. Vidutiniam naudotojui šis pojūtis dažnai apibūdinamas kaip keistas „tampymas“ arba išorinis impulsas, judinantis galūnę.
Iš esmės DI aplenkia tradicinius neuroninius takus. Paprastai jūsų smegenys siunčia elektros signalą stuburu į ranką. Šiuo atveju DI „įkelia“ tą signalą tiesiai į raumenį. Žvelgiant į platesnį vaizdą, šis prototipas įrodo, kad barjeras tarp programinės įrangos ir biologijos tampa vis skaidresnis.
| Komponentas | Vaidmuo „Human Operator“ sistemoje |
|---|---|
| Ant galvos tvirtinama kamera | „Akys“: fiksuoja aplinkos ir objektų vaizdą realiuoju laiku. |
| Vaizdo ir kalbos modelis (VLM) | „Smegenys“: apdoroja vaizdo duomenis ir paverčia ištartas instrukcijas veiksmų planais. |
| EMS valdiklis | „Nervų sistema“: paverčia DI planą į konkrečias elektros įtampas. |
| Elektrodų padeliai | „Vykdikliai“: tiekia impulsus į odą, kad susitrauktų dilbio ir riešo raumenys. |
Nors 48 valandų hakatono projektas retai kada būna paruoštas vietinei elektronikos parduotuvei, jo pasekmės vartotojų technologijoms yra perversminės ir plečiamos. Istoriškai fizinių užduočių mokėmės stebėdami ir kartodami – tai procesas, kuris dažnai yra lėtas ir linkęs į klaidas.
Įsivaizduokite pasaulį, kuriame „raumenų atmintį“ galima atsisiųsti. „Pasidaryk pats“ entuziastas galėtų dėvėti šio įrenginio versiją, kad išmoktų saugiai naudotis subtiliu medžio drožybos įrankiu. Medicinos studentas galėtų pajusti tikslų spaudimą, reikalingą chirurginiam pjūviui, kai DI valdoma ranka rodytų kelią. Kitaip tariant, mes pereiname nuo „pamokos žiūrėjimo“ prie „pamokos pajautimo“.
Rinkos požiūriu tai taip pat atveria didžiules duris pagalbinių technologijų pramonei. Asmenims, sveikstantiems po insulto ar nervų pažeidimų, pagrindinis iššūkis dažnai yra atotrūkis tarp smegenų noro judėti ir raumens gebėjimo reaguoti. Supaprastinta, DI valdoma EMS sistema galėtų veikti kaip skaitmeninis tiltas, padedantis pacientams atgauti mobilumą per intuityvesnę, automatizuotą fizinės terapijos formą.
Kad ir kaip įspūdinga būtų matyti studentų sukurtą įrenginį, judinantį ranką per dvi dienas, turėtume išlaikyti sveiką pragmatiško skepticizmo dozę. Žmogaus kūnas yra neįtikėtinai sudėtingas, o mūsų raumenų sistema nėra paprastas dvejetainių jungiklių rinkinys. Kiekvieno žmogaus fiziologinė sandara skiriasi; tai, kas vienam sukelia piršto krustelėjimą, kitam gali nieko nereiškia, o trečiam sukelti diskomfortą.
Be to, šių DI modelių logika kartais gali būti neskaidri. Jei DI neteisingai interpretuoja aplinką – supainioja aštrų peilį su nekenksmingu rašikliu – pasekmės dėl to, kad jis „perima“ jūsų rankos kontrolę, staiga tampa daug didesnės. Kyla esminis sutikimo ir saugumo klausimas, kuris dar nėra visiškai išspręstas: kaip užtikrinti, kad naudotojas galėtų akimirksniu perimti valdymą iš DI, jei kas nors nutiktų ne taip?
Šiuo metu šios sistemos yra pakankamai patikimos kontroliuojamai laboratorijai ar scenos demonstracijai, tačiau realus pasaulis yra netvarkingas ir nepastovus. „Skaitmeninė žalia nafta“ – duomenys, kurie maitina šiuos modelius – turi būti neįtikėtinai tikslūs, kad susidorotų su žmogaus judėjimo niuansais nesukeliant įtampos ar traumų.
Galiausiai „Human Operator“ projektas nėra tik apie rankos judinimą; tai apie besikeičiančią paradigmą, kaip mes vertiname savo santykį su mašinomis. Esame pripratę prie įrankių, kuriuos patys valdome (pavyzdžiui, automobilio ar pelės), tačiau žengiame į įrankių, kurie valdo mus, erą.
Praktiškai kalbant, ši technologija greičiausiai pirmiausia pasirodys sunkiojoje pramonėje arba didelės rizikos mokymo aplinkose, kol pasieks gyvenamuosius kambarius. Daug lengviau pateisinti sudėtingą DI ir raumenų sąsają mokant techniką dirbti su pavojingomis medžiagomis, nei mokant hobio mėgėją groti ukulėle. Tačiau techninei įrangai tampant labiau decentralizuotai, o programinei įrangai – tvirtesnei, riba ir toliau nyks.
Vidutiniam žmogui pagrindinė išvada paprasta: atkreipkite dėmesį į „dėvimųjų“ įrenginių erdvę. Pastarąjį dešimtmetį praleidome stebėdami savo žingsnius ir širdies ritmą. Kitas dešimtmetis greičiausiai bus skirtas tų pačių prietaisų naudojimui, siekiant aktyviai daryti įtaką tam, kaip judame ir mokomės. Nesvarbu, ar esate pasiruošę leisti DI „perimti vairą“ jūsų rankai, ar ne, technologija tam įgyvendinti jau kuriama bendrabučių kambariuose ir laboratorijose visame pasaulyje.
Šaltiniai:



Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.
/ Sukurti nemokamą paskyrą