Dirbtinis intelektas

Didžiausia grėsmė DI saugumui yra pati save kurianti programinė įranga

„Anthropic“ vienas iš įkūrėjų Jackas Clarkas įspėja, kad rekursyvusis DI tobulėjimas gali lemti žmogaus kontrolės praradimą. Štai kodėl pramonei reikalingas stabdžių pedalas.

Alwin Davies

Vyresnysis technologijų korespondentas

2026 m. birželio 5 d.

Didžiausia grėsmė DI saugumui yra pati save kurianti programinė įranga

Nors daugelis vartotojų dirbtinį intelektą laiko pasyviu skaitmeniniu asistentu, kuris laukia užklausos, kad pradėtų veikti, tikrovė tokia, kad ši technologija sparčiai tampa savo pačios architektu. Mes dažnai įsivaizduojame programuotoją, sėdintį prie stalo ir rašantį kodo eilutes, kad pokalbių robotas taptų išmanesnis. Šis vaizdinys vis labiau sensta. „Anthropic“ vienas iš įkūrėjų Jackas Clarkas neseniai atskleidė, kad 80 % jų DI „Claude“ programavimo darbų jau atlieka pats DI. Tikimasi, kad per dvejus metus šis skaičius pasieks 100 %. Šis pokytis žymi rekursyviojo savitobulinimo pradžią – procesą, kurio metu mašina kuria savo įpėdinį be žmogaus įsikišimo.

Mašinos savitobulinimo koncepcija skamba kaip efektyvumo svajonė, tačiau ji sukuria esminę saugumo problemą. Paprastai tariant, DI pramonė šiuo metu yra pastatyta vien ant akceleratoriaus pedalo. Įmonės lenktyniauja, siekdamos sukurti greitesnius, didesnius ir pajėgesnius modelius, kad užimtų rinkos dalį. Tačiau, kaip pažymi J. Clarkas, automobilis neturi stabdžių pedalo. Jei DI sistema tampa pakankamai pajėgi apmokyti kitą savo versiją, žmonės praranda galimybę patikrinti naujojo modelio saugumą ar logiką. Taip sukuriamas ciklas, kuriame technologijos juda greičiau nei mūsų gebėjimas jas suprasti ar valdyti.

Kaip rekursyvusis savitobulinimas veikia praktiškai

Norėdami suprasti, kodėl tai yra didžiulis pokytis, galime į DI pažvelgti kaip į nenuilstantį praktikantą. Tradiciškai šis praktikantas vykdydavo konkrečius vadovo nurodymus. Vadovas tikrindavo darbą, taisydavo klaidas ir nuspręsdavo, kada praktikantas yra pasirengęs prisiimti daugiau atsakomybės. Rekursyvusis savitobulinimas visiškai pakeičia šią dinamiką. Praktikantas dabar pats rašo biuro vadovą, apmoko kitą naujokų grupę ir perkuria įmonės darbo eigą, kol vadovo nėra kabinete.

„Anthropic“ jau pastebėjo tai vykstant su „Claude“. DI dabar gali pats atlikti tyrimų eksperimentus. Paklaustas sudėtingo klausimo apie modelių priežiūrą, DI ne tik pateikė atsakymą. Jis sukūrė metodiką, išbandė savo teorijas ir padarė išvadą be žmogaus vadovavimo. Tuo pat metu dažnumas, kuriuo darbuotojai turi taisyti „Claude“ kodą, per pastaruosius metus nuolat mažėjo. Programinė įranga daro mažiau klaidų, nes mokosi iš savo ankstesnių iteracijų.

Rekursyviajame modelyje DI agentai veikia kaip autonomiški darbuotojai. Šie agentai gali kurti ir mokyti naujus modelius, sukurdami grįžtamojo ryšio kilpą, kurioje programinė įranga tobulėja eksponentiniu greičiu. Žvelgiant į bendrą vaizdą, tai reiškia, kad žmogaus vaidmuo siaurėja kiekviename kūrimo proceso etape. Mes tampame ne technologijų kūrėjais, o proceso, kurio nebegalime iki galo sekti, prižiūrėtojais.

Trūkstamas stabdžių pedalas pasaulinėse lenktynėse

Rekursyviojo DI siekį skatina milžiniškos kūrimo sąnaudos. Aukščiausio lygio DI modeliui apmokyti reikia tūkstančių specializuotų lustų ir milijardų dolerių vertės elektros energijos. Jei įmonė gali naudoti esamą DI, kad automatizuotų kito modelio mokymą, ji sutaupo milžinišką kiekį laiko ir pinigų. Rinkos požiūriu, pirmoji įmonė, sukūrusi visiškai savarankiškai besitobulinančią sistemą, įgyja didžiulį konkurencinį pranašumą. Šis ekonominis spaudimas sukuria sisteminę paskatą laikyti akceleratorių nuspaustą iki dugno.

„Anthropic“ ragina sudaryti kolektyvinį susitarimą sukurti stabdžių pedalą. Praktiškai tai apimtų sistemą, skirtą stebėti, ar kūrėjai lėtina perėjimą prie visiškos rekursijos. Tačiau viena įmonė negali nuspręsti sustoti pati. Jei viena laboratorija nuspaus stabdžius, o kitos toliau greitės, sustojusi laboratorija praras savo reikšmę ir galimybę daryti įtaką pramonei.

Norint pasiekti realų sulėtėjimą, reikia, kad kelios gerai aprūpintos laboratorijos keliose šalyse susitartų dėl tų pačių pauzės sąlygų. Tai sunku, nes DI pramonė šiuo metu yra decentralizuota konkurencija. Kaip nė viena šalis nenori pirmoji nustoti kurti pažangios ginkluotės, taip nė viena technologijų milžinė nenori pirmoji apriboti savo programinės įrangos kūrimo greičio. Rezultatas – nepastovi aplinka, kurioje greičiui teikiama pirmenybė prieš gebėjimą išlaikyti žmogaus vykdomą priežiūrą.

Kodėl kontrolės praradimas svarbus paprastam vartotojui

Vidutiniam vartotojui idėja apie save kuriantį DI gali atrodyti kaip tolima mokslininkų problema. Tačiau iš esmės šis pokytis turi apčiuopiamą poveikį tam, kaip mes sąveikaujame su technologijomis. Kai kodą rašo žmogus, lieka loginis pėdsakas, kuriuo gali sekti kitas žmogus. Jei kodas sukelia privatumo nutekėjimą ar šališką sprendimą, programuotojas gali rasti konkrečią kodo eilutę ir ją ištaisyti.

Kai DI sukuria savo įpėdinį, ši logika tampa nepermatoma. Mes dar labiau grimztame į „juodosios dėžės“ problemą, kai mašina pateikia rezultatą, bet mes neturime galimybės sužinoti, kaip ji priėmė tą išvadą. Tai veikia viską – nuo to, kaip bankas vertina jūsų kredito reitingą, iki to, kaip medicininis DI diagnozuoja ligą. Jei sistema tobulėja be priežiūros, negalime garantuoti, kad joje neatsiranda paslėpto šališkumo ar nenuspėjamo elgesio, kuris galėtų pakenkti vartotojams.

Taip pat svarbus saugumo klausimas. Jei DI geba visiškai savarankiškai kurti savo įpėdinius, šių sistemų apsaugos ir stebėjimo būdai tampa sudėtingesni. Besitobulinantis DI teoriškai galėtų rasti ir pasinaudoti savo paties saugumo spragomis greičiau, nei žmonių komanda spėtų jas ištaisyti. Iš esmės mes kuriame skaitmeninę ekosistemą, kuri gali vystytis savarankiškai, potencialiai peraugdama mūsų turimus saugumo tinklus.

Pokytis iš kūrėjo į prižiūrėtoją

Istoriškai pramonės pažanga visada buvo susijusi su žmonėmis, valdančiais įrankius. Nuo garo variklio iki surinkimo linijos – žmogus visada buvo galutinis autoritetas mašinos veikimui. DI nutraukia šią istorinę grandinę. Siaurėjant žmogaus vaidmeniui, mūsų pagrindinis darbas keičiasi iš programinės įrangos kūrimo į stebėjimą, kaip programinė įranga kuria pati save.

Šiam perėjimui reikia naujų skaidrumo įrankių. Pačios „Anthropic“ tyrimų institutas kuria sistemas, skirtas rekursyviojo DI pažangai tikrinti, tačiau technologijos juda greičiau nei reguliavimas. Vartotojo požiūriu tai reiškia, kad žengiame į erą, kurioje produktai, kuriais naudojamės kasdien, nebėra tiesioginis žmogaus išradingumo rezultatas. Jie yra mašinos interpretacijos apie žmogaus poreikius rezultatas.

Įdomu tai, kad tai nereiškia, jog technologija taps mažiau naudinga. Tiesą sakant, rekursyvusis DI tikriausiai padės pasiekti proveržių sveikatos apsaugos ir mokslo srityse, kurie anksčiau buvo neįmanomi. Jis galėtų atrasti naujas medžiagas baterijoms arba rasti efektyvesnių būdų valdyti pasaulines tiekimo grandines. Nauda yra precedento neturinti, tačiau ji susijusi su sistemine rizika, kurią pramonė tik pradeda spręsti.

Navigacija besitobulinančiame skaitmeniniame pasaulyje

Esmė ta, kad DI pramonė artėja prie taško, iš kurio nebus kelio atgal. Kai technologija taps pajėgi 100 % savitobulinimui, žmogaus galimybė įsikišti taps ribota. Šiuo metu esame trumpame laiko tarpe, kai vis dar galime nuspręsti, kiek kontrolės norime išlaikyti.

Vidutiniam vartotojui geriausias kelias yra stebėti, kiek autonomijos suteikiame programėlėms ir paslaugoms, kuriomis naudojamės. Turėtume ieškoti įmonių, kurios teikia pirmenybę skaidrumui ir trečiųjų šalių atliekamiems jų modelių auditams. Suvokimas, kad jūsų programinė įranga dabar pati rašo savo scenarijų, yra pirmas žingsnis reikalaujant geresnės priežiūros iš tų, kurie laiko nuspaudę akceleratoriaus pedalą.

Galiausiai tikslas nėra sustabdyti pažangą, bet užtikrinti, kad ši pažanga atitiktų žmonių saugumą. Kai DI pradeda mokyti DI, poreikis sudaryti pasaulinį susitarimą dėl stabdžių pedalo tampa vis skubesnis. Turime užtikrinti, kad net jei darbą atlieka mašina, žmogus vis tiek būtų tas, kuris nusprendžia, kur važiuoja automobilis.

Šaltiniai: Anthropic, BBC World News, Jack Clark interviu.

#Anthropic #DirbtinisIntelektas #JackClark #RekursyvusisSavitobulinimas #TechnologijųValdymas

Iki pasimatymo kitoje pusėje.

Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.

/ Sukurti nemokamą paskyrą

Pasirinktiniai domenai

Iki 1 TB talpos saugykla

Išplėstinis bendrinimas

Galutinis šifravimas

Savaime susinaikinantys el. laiškai

Pasirinktiniai domenai

Iki 1 TB talpos saugykla

Išplėstinis bendrinimas

Galutinis šifravimas

Savaime susinaikinantys el. laiškai

Beeble Mail

Beeble Drive

Apie Beeble

Misija

Istorija

Premium

Bendrieji klausimai

Paaukoti

Kontaktai