Mākslīgais intelekts

Lielākais drauds mākslīgā intelekta drošībai ir programmatūra, kas pati sevi veido

Anthropic līdzdibinātājs Džeks Klarks brīdina, ka rekursīva MI pašpilnveidošanās varētu novest pie kontroles zaudēšanas. Lūk, kāpēc nozarei ir nepieciešams bremžu pedālis.
Lielākais drauds mākslīgā intelekta drošībai ir programmatūra, kas pati sevi veido

Kamēr daudzi lietotāji uzskata mākslīgo intelektu par pasīvu digitālo asistentu, kas gaida uzvedni, lai rīkotos, realitāte ir tāda, ka tehnoloģija strauji kļūst par savu arhitektu. Mēs bieži iztēlojamies cilvēku programmētāju, kurš sēž pie galda un raksta koda rindiņas, lai padarītu tērzēšanas robotu viedāku. Šis tēls kļūst arvien novecojušāks. Anthropic līdzdibinātājs Džeks Klarks nesen atklāja, ka 80% no programmēšanas darba viņu MI, Claude, jau veic pats MI. Paredzams, ka divu gadu laikā šis skaitlis sasniegs 100%. Šī pāreja iezīmē rekursīvās pašpilnveidošanās sākumu — procesu, kurā mašīna būvē savu pēcteci bez cilvēka iesaistes.

Koncepcija par mašīnu, kas pati sevi pilnveido, izklausās pēc efektivitātes sapņa, taču tā rada fundamentālu drošības problēmu. Vienkāršiem vārdiem sakot, MI nozare pašlaik ir pilnībā balstīta uz gāzes pedāļa. Uzņēmumi sacenšas, lai padarītu modeļus ātrākus, lielākus un spējīgākus, lai iekarotu tirgus daļu. Tomēr, kā norāda Klarks, automašīnai nav bremžu pedāļa. Ja MI sistēma kļūst pietiekami spējīga, lai apmācītu nākamo savu versiju, cilvēki zaudē spēju pārbaudīt jaunā modeļa drošību vai loģiku. Tas rada ciklu, kurā tehnoloģija attīstās ātrāk nekā mūsu spēja to izprast vai pārvaldīt.

Kā rekursīvā pašpilnveidošanās darbojas praksē

Lai saprastu, kāpēc šīs ir milzīgas pārmaiņas, mēs varam uzlūkot MI kā nenogurdināmu praktikantu. Tradicionāli šis praktikants izpildīja konkrētus vadītāja norādījumus. Vadītājs pārbaudīja darbu, laboja kļūdas un izlēma, kad praktikants ir gatavs lielākai atbildībai. Rekursīvā pašpilnveidošanās pilnībā maina šo dinamiku. Praktikants tagad raksta biroja rokasgrāmatu, apmāca nākamo darbinieku grupu un pārveido uzņēmuma darba plūsmu, kamēr vadītājs nav telpā.

Anthropic jau ir novērojis, ka tas notiek ar Claude. MI tagad spēj veikt savus pētniecības eksperimentus. Kad tam uzdeva sarežģītu jautājumu par modeļu uzraudzību, MI ne tikai sniedza atbildi. Tas izstrādāja metodoloģiju, pārbaudīja savas teorijas un nonāca pie secinājuma bez cilvēka vadības. Tajā pašā laikā biežums, kādā cilvēku personālam ir jālabo Claude kods, pēdējā gada laikā ir pastāvīgi samazinājies. Programmatūra pieļauj mazāk kļūdu, jo tā mācās no savām iepriekšējām iterācijām.

Rekursīvajā modelī MI aģenti darbojas kā autonomi darbinieki. Šie aģenti var izveidot un apmācīt jaunus modeļus, radot atgriezeniskās saites cilpu, kurā programmatūra uzlabojas eksponenciāli. Raugoties uz kopējo ainu, tas nozīmē, ka cilvēka loma sašaurinās katrā izstrādes procesa posmā. Mēs pārvēršamies no tehnoloģijas radītājiem par procesa uzraugiem, kuram vairs nevaram pilnībā izsekot.

Trūkstošais bremžu pedālis globālajā sacensībā

Vēlmi pēc rekursīvā MI veicina milzīgās izstrādes izmaksas. Augstākā līmeņa MI modeļa apmācībai ir nepieciešami tūkstošiem specializētu mikroshēmu un miljardiem dolāru vērta elektrība. Ja uzņēmums var izmantot esošu MI, lai automatizētu nākamā modeļa apmācību, tas ietaupa milzīgu laiku un naudu. No tirgus viedokļa pirmajam uzņēmumam, kas sasniegs pilnībā pašpilnveidojošos sistēmu, būs milzīgas konkurences priekšrocības. Šis ekonomiskais spiediens rada sistēmisku stimulu turēt gāzes pedāli nospiestu līdz galam.

Anthropic aicina noslēgt kolektīvu vienošanos par bremžu pedāļa izveidi. Praktiski tas ietvertu sistēmu, lai uzraudzītu, vai izstrādātāji palēnina virzību uz pilnīgu rekursiju. Tomēr viens uzņēmums nevar izvēlēties apstāties pats no sevis. Ja viena laboratorija nospiež bremzes, kamēr citas turpina paātrināties, laboratorija, kas apstājās, zaudē savu nozīmi un spēju ietekmēt nozari.

Reālai palēnināšanai ir nepieciešams, lai vairākas labi nodrošinātas laboratorijas vairākās valstīs vienotos par vienādiem nosacījumiem pauzei. Tas ir grūti, jo MI nozare pašlaik ir decentralizēta konkurence. Tāpat kā neviena valsts nevēlas būt pirmā, kas pārtrauc progresīvu ieroču izstrādi, neviens tehnoloģiju gigants nevēlas būt pirmais, kas ierobežo savas programmatūras izstrādes ātrumu. Rezultāts ir nestabila vide, kurā ātrums tiek prioritizēts pār spēju saglabāt cilvēka uzraudzību.

Kāpēc kontroles zaudēšana ir svarīga vidusmēra lietotājam

Ikvienam lietotājam ideja par MI, kas pats sevi būvē, varētu šķist tāla zinātnieku problēma. Tomēr "zem pārsega" šīs izmaiņas jūtami ietekmē to, kā mēs mijiedarbojamies ar tehnoloģijām. Kad cilvēks raksta kodu, paliek loģikas pēdas, kurām cits cilvēks var izsekot. Ja kods izraisa privātuma noplūdi vai neobjektīvu lēmumu, izstrādātājs var atrast konkrēto koda rindiņu un to izlabot.

Kad MI izveido savu pēcteci, šī loģika kļūst nepārredzama. Mēs arvien vairāk saskaramies ar "melnās kastes" problēmu, kurā mašīna sniedz rezultātu, bet mums nav iespējas uzzināt, kā tā nonāca pie šāda secinājuma. Tas ietekmē visu — no tā, kā banka novērtē jūsu kredītreitingu, līdz tam, kā medicīniskais MI diagnosticē slimību. Ja sistēma pašpilnveidojas bez uzraudzības, mēs nevaram garantēt, ka tajā nerodas slēpti aizspriedumi vai neparedzama uzvedība, kas varētu kaitēt lietotājiem.

Pastāv arī drošības jautājums. Ja MI spēj pilnībā izveidot savus pēctečus, veidi, kā mēs aizsargājam un uzraugām šīs sistēmas, kļūst sarežģītāki. Pašpilnveidojošs MI teorētiski varētu atrast un izmantot ievainojamības savā drošības sistēmā ātrāk, nekā cilvēku komanda spētu tās novērst. Būtībā mēs veidojam digitālo ekosistēmu, kas var attīstīties pati, potenciāli pāraugot mūsu izveidotos drošības tīklus.

Pāreja no radītāja par uzraugu

Vēsturiski rūpnieciskais progress vienmēr ir ietvēris cilvēkus, kas pārvalda rīkus. No tvaika dzinēja līdz montāžas līnijai — cilvēks vienmēr bija galīgā autoritāte mašīnas darbībā. MI pārtrauc šo vēsturisko ķēdi. Cilvēka lomai sašaurinoties, mūsu galvenais uzdevums mainās no programmatūras izstrādes uz vērošanu, kā programmatūra būvē pati sevi.

Šī pāreja prasa jaunu rīku kopumu caurskatāmībai. Anthropic pētniecības institūts strādā pie sistēmām, lai pārbaudītu rekursīvā MI progresu, taču tehnoloģija attīstās ātrāk nekā regulējums. No patērētāja viedokļa tas nozīmē, ka mēs ieejam laikmetā, kurā produkti, ko lietojam ikdienā, vairs nav tiešs cilvēka atjautības rezultāts. Tie ir mašīnas interpretācijas rezultāts par cilvēka vajadzībām.

Interesanti, ka tas nenozīmē, ka tehnoloģija kļūs mazāk noderīga. Faktiski rekursīvais MI, visticamāk, novedīs pie atklājumiem veselības aprūpē un zinātnē, kas iepriekš nebija iespējami. Tas varētu atklāt jaunus materiālus akumulatoriem vai atrast efektīvākus veidus, kā pārvaldīt globālās piegādes ķēdes. Ieguvumi ir nepieredzēti, taču tie nāk ar sistēmisku risku, kuru nozare tikai sāk apzināt.

Orientēšanās pašpilnveidojošā digitālajā pasaulē

Galvenā atziņa ir tāda, ka MI nozare tuvojas punktam, no kura vairs nav atgriešanās. Tiklīdz tehnoloģija būs spējīga uz 100% pašpilnveidošanos, cilvēka spēja iejaukties kļūs ierobežota. Pašlaik mēs atrodamies īsā laika posmā, kurā joprojām varam izlemt, cik lielu kontroli vēlamies saglabāt.

Vidusmēra lietotājam labākais ceļš uz priekšu ir palikt vērīgam pret to, cik lielu autonomiju mēs piešķiram lietotnēm un pakalpojumiem, kurus izmantojam. Mums vajadzētu meklēt uzņēmumus, kas par prioritāti izvirza caurskatāmību un trešo pušu auditus saviem modeļiem. Izpratne par to, ka jūsu programmatūra tagad pati raksta savu scenāriju, ir pirmais solis, lai pieprasītu labāku uzraudzību no tiem, kuru rokās ir gāzes pedālis.

Galu galā mērķis nav apturēt progresu, bet gan nodrošināt, lai progress joprojām saskanētu ar cilvēku drošību. MI sākot apmācīt MI, nepieciešamība pēc globālas vienošanās par bremžu pedāli kļūst steidzamāka. Mums ir jānodrošina, ka pat tad, ja darbu veic mašīna, cilvēks joprojām ir tas, kurš izlemj, kurp automašīna brauc.

Avoti: Anthropic, BBC World News, Jack Clark Interview.

bg
bg
bg

Uz tikšanos otrā pusē.

Mūsu end-to-end šifrētais e-pasta un mākoņdatu glabāšanas risinājums nodrošina visefektīvākos līdzekļus drošai datu apmaiņai, garantējot jūsu datu drošību un konfidencialitāti.

/ Izveidot bezmaksas kontu