Dirbtinis intelektas

Didžiausia grėsmė DI saugumui – pati save kurianti programinė įranga

„Anthropic“ vienas iš įkūrėjų Jackas Clarkas įspėja, kad rekursyvus DI savęs tobulinimas gali lemti žmogaus kontrolės praradimą. Štai kodėl pramonei reikia stabdžių pedalo.

Alwin Davies

Vyresnysis technologijų korespondentas

2026 m. birželio 5 d.

Didžiausia grėsmė DI saugumui – pati save kurianti programinė įranga

Nors daugelis vartotojų dirbtinį intelektą laiko pasyviu skaitmeniniu asistentu, laukiančiu užklausos veikti, realybė tokia, kad ši technologija sparčiai tampa savo pačios architektu. Mes dažnai įsivaizduojame programuotoją, sėdintį prie stalo ir rašantį kodo eilutes, kad pokalbių robotas taptų išmanesnis. Šis vaizdinys vis labiau sensta. „Anthropic“ vienas iš įkūrėjų Jackas Clarkas neseniai atskleidė, kad 80 % jų DI modelio „Claude“ kodavimo darbų jau atlieka pats DI. Tikimasi, kad per dvejus metus šis skaičius pasieks 100 %. Šis poslinkis žymi rekursyvaus savęs tobulinimo pradžią – procesą, kurio metu mašina kuria savo įpėdinį be žmogaus įsikišimo.

Mašinos savęs tobulinimo koncepcija skamba kaip efektyvumo svajonė, tačiau ji sukuria esminę saugumo problemą. Paprastai tariant, DI pramonė šiuo metu yra sukonstruota tik iš akceleratoriaus pedalo. Įmonės lenktyniauja, kad modeliai būtų greitesni, didesni ir pajėgesni, siekdamos užimti rinkos dalį. Tačiau, kaip pažymi J. Clarkas, automobilis neturi stabdžių pedalo. Jei DI sistema tampa pakankamai pajėgi apmokyti kitą savo versiją, žmonės praranda galimybę patikrinti naujojo modelio saugumą ar logiką. Tai sukuria ciklą, kuriame technologijos juda greičiau nei mūsų gebėjimas jas suprasti ar valdyti.

Kaip rekursyvus savęs tobulinimas veikia praktiškai

Norėdami suprasti, kodėl tai yra didžiulis pokytis, galime pažvelgti į DI kaip į nenuilstantį praktikantą. Tradiciškai šis praktikantas vykdydavo konkrečius vadovo nurodymus. Vadovas tikrindavo darbą, taisydavo klaidas ir nuspręsdavo, kada praktikantas yra pasirengęs didesnei atsakomybei. Rekursyvus savęs tobulinimas visiškai pakeičia šią dinamiką. Praktikantas dabar pats rašo biuro vadovą, moko naujus darbuotojus ir perkuria įmonės darbo eigą, kol vadovo nėra kabinete.

„Anthropic“ jau pastebėjo, kad tai vyksta su „Claude“. DI dabar gali pats atlikti savo tyrimų eksperimentus. Paklaustas sudėtingo klausimo apie modelių priežiūrą, DI ne tik pateikė atsakymą. Jis sukūrė metodiką, išbandė savo teorijas ir padarė išvadą be žmogaus vadovavimo. Tuo pat metu darbuotojų poreikis taisyti „Claude“ kodą per pastaruosius metus nuolat mažėjo. Programinė įranga daro mažiau klaidų, nes mokosi iš savo ankstesnių iteracijų.

Rekursyviame modelyje DI agentai veikia kaip autonominiai darbuotojai. Šie agentai gali kurti ir mokyti naujus modelius, sukurdami grįžtamojo ryšio kilpą, kurioje programinė įranga tobulėja eksponentiniu greičiu. Žvelgiant į bendrą vaizdą, tai reiškia, kad žmogaus vaidmuo siaurėja kiekviename kūrimo proceso etape. Mes tampame nebe technologijų kūrėjais, o proceso, kurio nebegalime iki galo sekti, prižiūrėtojais.

Trūkstamas stabdžių pedalas pasaulinėse lenktynėse

Rekursyvaus DI siekį skatina milžiniškos kūrimo išlaidos. Aukščiausio lygio DI modeliui apmokyti reikia tūkstančių specializuotų lustų ir milijardų dolerių vertės elektros energijos. Jei įmonė gali naudoti esamą DI, kad automatizuotų kito modelio mokymą, ji sutaupo milžinišką kiekį laiko ir pinigų. Rinkos požiūriu, pirmoji įmonė, sukūrusi visiškai save tobulinančią sistemą, įgyja didžiulį konkurencinį pranašumą. Šis ekonominis spaudimas sukuria sisteminę paskatą laikyti nuspaustą akceleratoriaus pedalą.

„Anthropic“ ragina sudaryti kolektyvinį susitarimą dėl stabdžių pedalo sukūrimo. Praktiškai tai apimtų sistemą, skirtą stebėti, ar kūrėjai lėtina perėjimą prie visiškos rekursijos. Tačiau viena įmonė negali nuspręsti sustoti pati. Jei viena laboratorija nuspaus stabdžius, o kitos toliau greitės, sustojusi laboratorija praras savo aktualumą ir galimybę daryti įtaką pramonei.

Norint pasiekti realų sulėtėjimą, reikia, kad kelios gerai aprūpintos laboratorijos keliose šalyse susitartų dėl tų pačių pauzės sąlygų. Tai sudėtinga, nes DI pramonė šiuo metu yra decentralizuota konkurencija. Kaip nė viena šalis nenori pirmoji nustoti kurti pažangios ginkluotės, taip nė viena technologijų milžinė nenori pirmoji apriboti savo programinės įrangos kūrimo greičio. Rezultatas – nepastovi aplinka, kurioje greitis yra svarbesnis už gebėjimą išlaikyti žmogaus priežiūrą.

Kodėl kontrolės praradimas svarbus vidutiniam vartotojui

Kasdieniam vartotojui idėja apie save kuriantį DI gali atrodyti kaip tolima mokslininkų problema. Tačiau iš esmės šis pokytis turi apčiuopiamą poveikį tam, kaip mes sąveikaujame su technologijomis. Kai kodą rašo žmogus, lieka logikos pėdsakas, kuriuo gali sekti kitas žmogus. Jei kodas sukelia privatumo nutekėjimą ar šališką sprendimą, programuotojas gali rasti konkrečią kodo eilutę ir ją ištaisyti.

Kai DI sukuria savo įpėdinį, ši logika tampa nepermatoma. Mes dar labiau grimztame į „juodosios dėžės“ problemą, kai mašina pateikia rezultatą, bet mes neturime galimybės sužinoti, kaip ji priėmė tą išvadą. Tai veikia viską – nuo to, kaip bankas vertina jūsų kredito reitingą, iki to, kaip medicininis DI diagnozuoja ligą. Jei sistema tobulėja be priežiūros, negalime garantuoti, kad joje neatsiranda paslėptų šališkumų ar nenuspėjamo elgesio, kuris galėtų pakenkti vartotojams.

Taip pat kyla saugumo klausimas. Jei DI sugeba visiškai sukurti savo įpėdinius, šių sistemų apsaugos ir stebėjimo būdai tampa sudėtingesni. Save tobulinantis DI teoriškai galėtų rasti ir išnaudoti savo saugumo spragas greičiau, nei žmonių komanda spėtų jas sutvarkyti. Iš esmės mes kuriame skaitmeninę ekosistemą, kuri gali vystytis pati, potencialiai peraugdama mūsų turimus saugumo tinklus.

Pokytis iš kūrėjo į prižiūrėtoją

Istoriškai pramonės pažanga visada buvo susijusi su žmonėmis, valdančiais įrankius. Nuo garo variklio iki surinkimo linijos – žmogus visada buvo galutinis autoritetas mašinos veikimui. DI nutraukia šią istorinę grandinę. Siaurėjant žmogaus vaidmeniui, mūsų pagrindinis darbas keičiasi iš programinės įrangos kūrimo į stebėjimą, kaip programinė įranga kuria pati save.

Šiam perėjimui reikia naujų skaidrumo priemonių. Pačios „Anthropic“ tyrimų institutas kuria sistemas, skirtas rekursyvaus DI pažangai tikrinti, tačiau technologijos juda greičiau nei reguliavimas. Vartotojo požiūriu tai reiškia, kad žengiame į erą, kurioje produktai, kuriais naudojamės kasdien, nebėra tiesioginis žmogaus išradingumo rezultatas. Jie yra mašinos interpretacijos apie žmogaus poreikius rezultatas.

Įdomu tai, kad tai nereiškia, jog technologija taps mažiau naudinga. Tiesą sakant, rekursyvus DI tikriausiai padės pasiekti proveržių sveikatos apsaugos ir mokslo srityse, kurie anksčiau buvo neįmanomi. Jis galėtų atrasti naujas medžiagas baterijoms arba rasti efektyvesnių būdų valdyti pasaulines tiekimo grandines. Nauda yra precedento neturinti, tačiau ji susijusi su sistemine rizika, kurią pramonė tik pradeda spręsti.

Orientavimasis save tobulinančiame skaitmeniniame pasaulyje

Esmė ta, kad DI pramonė artėja prie negrįžtamo taško. Kai technologija tampa pajėgi 100 % savęs tobulinimui, žmogaus galimybė įsikišti tampa ribota. Šiuo metu esame trumpame laikotarpyje, kai dar galime nuspręsti, kiek kontrolės norime išlaikyti.

Vidutiniam vartotojui geriausias kelias yra stebėti, kiek autonomijos suteikiame naudojamoms programėlėms ir paslaugoms. Turėtume ieškoti įmonių, kurios teikia pirmenybę skaidrumui ir trečiųjų šalių atliekamiems jų modelių auditams. Suvokimas, kad jūsų programinė įranga dabar pati rašo savo scenarijų, yra pirmas žingsnis reikalaujant geresnės priežiūros iš tų, kurie laiko nuspaudę akceleratoriaus pedalą.

Galiausiai tikslas yra ne sustabdyti pažangą, o užtikrinti, kad ji atitiktų žmonių saugumą. Kai DI pradeda mokyti DI, poreikis sudaryti pasaulinį susitarimą dėl stabdžių pedalo tampa vis skubesnis. Turime užtikrinti, kad net jei darbą atlieka mašina, žmogus vis tiek būtų tas, kuris nusprendžia, kur važiuoja automobilis.

Šaltiniai: Anthropic, BBC World News, Jack Clark Interview.

#Anthropic #DirbtinisIntelektas #JackClark #RekursyvusSavęsTobulinimas #TechnologijųValdymas

Iki pasimatymo kitoje pusėje.

Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.

/ Sukurti nemokamą paskyrą

Pasirinktiniai domenai

Iki 1 TB talpos saugykla

Išplėstinis bendrinimas

Galutinis šifravimas

Savaime susinaikinantys el. laiškai

Pasirinktiniai domenai

Iki 1 TB talpos saugykla

Išplėstinis bendrinimas

Galutinis šifravimas

Savaime susinaikinantys el. laiškai

Beeble Mail

Beeble Drive

Apie Beeble

Misija

Istorija

Premium

Bendrieji klausimai

Paaukoti

Kontaktai