Tehisintellekt

Suurim oht tehisintellekti turvalisusele on tarkvara, mis ehitab end ise

Anthropicu kaasasutaja Jack Clark hoiatab, et tehisintellekti rekursiivne isearendamine võib viia kontrolli kaotamiseni inimeste poolt. Siin on selgitus, miks tööstus vajab piduripedaali.
Suurim oht tehisintellekti turvalisusele on tarkvara, mis ehitab end ise

Kuigi paljud kasutajad peavad tehisintellekti passiivseks digitaalseks assistendiks, mis ootab tegutsemiseks viipa, on tegelikkus see, et tehnoloogia on kiiresti muutumas omaenda arhitektiks. Me kujutame sageli ette inimprogrammeerijat istumas laua taga ja trükkimas koodiridu, et muuta juturobot targemaks. See pilt on üha enam vananenud. Anthropicu kaasasutaja Jack Clark paljastas hiljuti, et 80% nende tehisintellekti Claude koodikirjutamise tööst teeb juba tehisintellekt ise. Kahe aasta jooksul peaks see number jõudma 100%-ni. See muutus tähistab rekursiivse isearendamise algust – protsessi, kus masin ehitab oma järeltulija ilma inimese sekkumiseta.

The concept of a machine improving itself sounds like a dream for efficiency, but it creates a fundamental problem for safety. In simple terms, the AI industry is currently built entirely on a gas pedal. Companies are racing to make models faster, larger, and more capable to capture market share. However, as Clark points out, the car does not have a brake pedal. If an AI system becomes capable enough to train the next version of itself, humans lose the ability to verify the safety or the logic of the new model. This creates a cycle where the technology moves faster than our capacity to understand or govern it.

Kuidas rekursiivne isearendamine praktikas toimib

Mõistmaks, miks see on tohutu muutus, võime vaadata tehisintellekti kui väsimatut praktikanti. Traditsiooniliselt järgis see praktikant juhilt saadud konkreetseid juhiseid. Juht kontrollis tööd, parandas vead ja otsustas, millal praktikant on valmis suuremaks vastutuseks. Rekursiivne isearendamine muudab seda dünaamikat täielikult. Praktikant kirjutab nüüd kontori käsiraamatut, koolitab järgmist rühma uusi töötajaid ja kujundab ümber ettevõtte töövoogu ajal, mil juht on ruumist väljas.

Anthropic on juba täheldanud seda Claude'i puhul. Tehisintellekt on nüüd võimeline ise läbi viima uurimistöid. Kui talt küsiti keeruline küsimus mudeli järelevalve kohta, ei andnud tehisintellekt lihtsalt vastust. See töötas välja metoodika, testis oma teooriaid ja jõudis järeldusele ilma inimliku juhendamiseta. Samal ajal on kiirus, millega inimtöötajad peavad Claude'i koodi parandama, viimase aasta jooksul pidevalt langenud. Tarkvara teeb vähem vigu, sest ta õpib oma eelmistest iteratsioonidest.

Rekursiivses mudelis tegutsevad tehisintellekti agendid autonoomsete töötajatena. Need agendid saavad ehitada ja treenida uusi mudeleid, luues tagasisideahela, kus tarkvara paraneb eksponentsiaalse kiirusega. Suurt pilti vaadates tähendab see, et inimese roll aheneb arendusprotsessi igas etapis. Me liigume tehnoloogia loojatest protsessi ülevaatajateks, mida me ei suuda enam täielikult jälgida.

Puuduv piduripedaal globaalses võidujooksus

Ajendit rekursiivse tehisintellekti poole toidavad tohutud arenduskulud. Tipptasemel tehisintellekti mudeli treenimine nõuab tuhandeid spetsialiseeritud kiipe ja miljardeid dollareid elektrienergiat. Kui ettevõte saab kasutada olemasolevat tehisintellekti järgmise mudeli treenimise automatiseerimiseks, säästavad nad tohutult aega ja raha. Turu poolelt on esimesel ettevõttel, kes saavutab täielikult iseareneva süsteemi, tohutu konkurentsieelis. See majanduslik surve loob süsteemse stiimuli hoida gaasipedaal põhjas.

Anthropic kutsub üles sõlmima ühist kokkulepet piduripedaali loomiseks. Praktiliselt tähendaks see süsteemi, mis jälgiks, kas arendajad aeglustavad oma liikumist täieliku rekursiooni suunas. Ükski ettevõte ei saa aga üksi peatuda. Kui üks labor vajutab pidurit, samal ajal kui teised jätkavad kiirendamist, kaotab peatunud labor oma asjakohasuse ja võime tööstust mõjutada.

Tõelise aeglustumise saavutamine nõuab, et mitmed hästi varustatud laborid mitmes riigis lepiksid kokku samades pausi tingimustes. See on keeruline, sest tehisintellekti tööstus on praegu detsentraliseeritud konkurents. Nii nagu ükski riik ei taha olla esimene, kes lõpetab täiustatud relvastuse arendamise, ei taha ükski tehnoloogiahiid olla esimene, kes piirab oma tarkvaraarenduse kiirust. Tulemuseks on ebakindel keskkond, kus kiirus on prioriteetsem kui võime säilitada inimlikku järelevalvet.

Miks kontrolli kaotamine on tavakasutaja jaoks oluline

Tavakasutaja jaoks võib idee tehisintellektist, mis ehitab end ise, tunduda teadlaste kaugel asuva murena. Kapoti all on sellel muutusel aga käegakatsutav mõju sellele, kuidas me tehnoloogiaga suheldes toimime. Kui inimene kirjutab koodi, jääb maha loogiline jälg, mida teine inimene saab järgida. Kui kood põhjustab privaatsuslekke või erapooliku otsuse, saab arendaja leida konkreetse koodirea ja selle parandada.

Kui tehisintellekt ehitab oma järeltulija, muutub see loogika läbipaistmatuks. Me liigume sügavamale „musta kasti“ probleemi, kus masin annab tulemuse, kuid meil pole võimalust teada, kuidas ta selle järelduseni jõudis. See mõjutab kõike alates sellest, kuidas pank hindab teie krediidivõimekust, kuni selleni, kuidas meditsiiniline tehisintellekt diagnoosib haigust. Kui süsteem areneb ise ilma järelevalveta, ei saa me garanteerida, et sellel ei teki varjatud eelarvamusi või ettearvamatut käitumist, mis võiks kasutajaid kahjustada.

Küsimus on ka turvalisuses. Kui tehisintellekt on võimeline täielikult ehitama oma järeltulijaid, muutuvad nende süsteemide turvamise ja jälgimise viisid keerulisemaks. Isearenev tehisintellekt võiks teoreetiliselt leida ja ära kasutada haavatavusi omaenda turvasüsteemis kiiremini, kui inimmeeskond suudab neid parandada. Sisuliselt loome me digitaalset ökosüsteemi, mis suudab ise areneda, kasvades potentsiaalselt välja meil olemasolevatest turvavõrkudest.

Üleminek loojast ülevaatajaks

Ajalooliselt on tööstuslik progress alati hõlmanud inimeste poolt juhitavaid tööriistu. Aurumootorist konveierliinini oli inimene alati masina töö lõplik autoriteet. Tehisintellekt murrab seda ajaloolist ahelat. Kuna inimese roll aheneb, muutub meie põhiülesanne tarkvara ehitamisest selle jälgimiseks, kuidas tarkvara end ise ehitab.

See üleminek nõuab uusi vahendeid läbipaistvuse tagamiseks. Anthropicu enda uurimisinstituut töötab süsteemide kallal, et kontrollida rekursiivse tehisintellekti arengut, kuid tehnoloogia liigub kiiremini kui regulatsioonid. Tarbija seisukohast tähendab see, et me siseneme ajastusse, kus tooted, mida me igapäevaselt kasutame, ei ole enam inimliku leidlikkuse otsene tulemus. Need on masina tõlgendus inimeste vajadustest.

Huvitaval kombel ei tähenda see, et tehnoloogia muutuks vähem kasulikuks. Tegelikult viib rekursiivne tehisintellekt tõenäoliselt läbimurreteni tervishoius ja teaduses, mis olid varem võimatud. See võib avastada uusi materjale akude jaoks või leida tõhusamaid viise globaalsete tarneahelate haldamiseks. Kasu on enneolematu, kuid sellega kaasneb süsteemne risk, millega tööstus on alles alustamas tegelemist.

Navigeerimine isearenevas digimaailmas

Kokkuvõtteks võib öelda, et tehisintellekti tööstus on lähenemas punktile, kust tagasiteed ei ole. Kui tehnoloogia on võimeline 100%-liseks isearendamiseks, muutub inimeste sekkumisvõime piiratuks. Oleme praegu lühikeses ajaaknas, kus saame veel otsustada, kui palju kontrolli soovime säilitada.

Tavakasutaja jaoks on parim tee edasi jääda tähelepanelikuks selle suhtes, kui palju autonoomiat me kasutatavatele rakendustele ja teenustele anname. Peaksime otsima ettevõtteid, mis seavad prioriteediks läbipaistvuse ja oma mudelite kolmanda osapoole auditi. Mõistmine, et teie tarkvara kirjutab nüüd oma stsenaariumi, on esimene samm parema järelevalve nõudmisel inimestelt, kes hoiavad gaasipedaali.

Lõppkokkuvõttes ei ole eesmärk peatada progressi, vaid tagada, et progress jääks kooskõlla inimeste turvalisusega. Kuna tehisintellekt hakkab treenima tehisintellekti, muutub vajadus ülemaailmse kokkuleppe järele piduripedaali osas üha pakilisemaks. Peame tagama, et isegi kui masin teeb tööd, on inimene ikkagi see, kes otsustab, kuhu auto sõidab.

Allikad: Anthropic, BBC World News, Jack Clarki intervjuu.

bg
bg
bg

Kohtumiseni teisel poolel.

Meie läbivalt krüpteeritud e-posti ja pilvesalvestuse lahendus pakub kõige võimsamaid vahendeid turvaliseks andmevahetuseks, tagades teie andmete turvalisuse ja privaatsuse.

/ Tasuta konto loomin