Mākslīgais intelekts

Lielākais drauds MI drošībai ir programmatūra, kas pati sevi veido

Anthropic līdzdibinātājs Džeks Klārks brīdina, ka rekursīvā MI pašuzlabošanās var novest pie cilvēka kontroles zaudēšanas. Lūk, kāpēc nozarei ir nepieciešams bremžu pedālis.

Alwin Davies

Vecākais tehnoloģiju korespondents

2026. gada 5. jūnijs

Lielākais drauds MI drošībai ir programmatūra, kas pati sevi veido

Kamēr daudzi lietotāji uzskata mākslīgo intelektu par pasīvu digitālo asistentu, kas gaida uzvedni, lai rīkotos, realitāte ir tāda, ka tehnoloģija strauji kļūst par savu arhitektu. Mēs bieži iztēlojamies cilvēku programmētāju, kurš sēž pie galda un raksta koda rindiņas, lai padarītu tērzēšanas robotu viedāku. Šis attēls kļūst arvien novecojušāks. Anthropic līdzdibinātājs Džeks Klārks nesen atklāja, ka 80% no viņu MI, Claude, programmēšanas darba jau veic pats MI. Paredzams, ka divu gadu laikā šis skaitlis sasniegs 100%. Šī maiņa iezīmē rekursīvās pašuzlabošanās sākumu — procesu, kurā mašīna būvē savu pēcteci bez cilvēka iesaistes.

Koncepcija par mašīnu, kas pati sevi uzlabo, izklausās pēc efektivitātes sapņa, taču tā rada fundamentālu problēmu drošībai. Vienkāršiem vārdiem sakot, MI nozare pašlaik ir pilnībā balstīta uz gāzes pedāļa nospiešanu. Uzņēmumi sacenšas, lai padarītu modeļus ātrākus, lielākus un spējīgākus, lai iekarotu tirgus daļu. Tomēr, kā norāda Klārks, automašīnai nav bremžu pedāļa. Ja MI sistēma kļūst pietiekami spējīga, lai apmācītu nākamo savu versiju, cilvēki zaudē spēju pārbaudīt jaunā modeļa drošību vai loģiku. Tas rada ciklu, kurā tehnoloģija attīstās ātrāk nekā mūsu spēja to saprast vai pārvaldīt.

Kā rekursīvā pašuzlabošanās darbojas praksē

Lai saprastu, kāpēc šī ir milzīga pārmaiņa, mēs varam uzlūkot MI kā nenogurdināmu praktikantu. Tradicionāli šis praktikants izpildīja specifiskas vadītāja instrukcijas. Vadītājs pārbaudīja darbu, laboja kļūdas un izlēma, kad praktikants ir gatavs lielākai atbildībai. Rekursīvā pašuzlabošanās pilnībā maina šo dinamiku. Praktikants tagad pats raksta biroja rokasgrāmatu, apmāca nākamo darbinieku grupu un pārveido uzņēmuma darba plūsmu, kamēr vadītājs nav telpā.

Anthropic jau ir novērojis, ka tas notiek ar Claude. MI tagad spēj veikt savus pētniecības eksperimentus. Kad tam uzdeva sarežģītu jautājumu par modeļu uzraudzību, MI ne tikai sniedza atbildi. Tas izstrādāja metodoloģiju, pārbaudīja savas teorijas un nonāca pie secinājuma bez cilvēka vadības. Tajā pašā laikā biežums, ar kādu cilvēku personālam ir jālabo Claude kods, pēdējā gada laikā ir pastāvīgi samazinājies. Programmatūra pieļauj mazāk kļūdu, jo tā mācās no savām iepriekšējām iterācijām.

Rekursīvā modelī MI aģenti darbojas kā autonomi darbinieki. Šie aģenti var izveidot un apmācīt jaunus modeļus, radot atgriezeniskās saites cilpu, kurā programmatūra uzlabojas eksponenciālā ātrumā. Skatoties uz kopējo ainu, tas nozīmē, ka cilvēka loma sašaurinās katrā izstrādes procesa posmā. Mēs pārvēršamies no tehnoloģijas radītājiem par procesa uzraugiem, kuram vairs nevaram pilnībā izsekot.

Trūkstošais bremžu pedālis globālajā sacensībā

Dzinulis rekursīvajam MI ir milzīgās izstrādes izmaksas. Augstākā līmeņa MI modeļa apmācībai nepieciešami tūkstošiem specializētu mikroshēmu un miljardiem dolāru vērta elektroenerģija. Ja uzņēmums var izmantot esošu MI, lai automatizētu nākamā modeļa apmācību, tas ietaupa milzīgu laiku un naudu. Tirgus pusē pirmajam uzņēmumam, kas sasniegs pilnībā pašuzlabojošos sistēmu, būs milzīga konkurences priekšrocība. Šis ekonomiskais spiediens rada sistēmisku stimulu turēt gāzes pedāli nospiestu līdz galam.

Anthropic aicina noslēgt kolektīvu vienošanos par bremžu pedāļa izveidi. Praktiski tas ietvertu sistēmu, lai uzraudzītu, vai izstrādātāji palēnina savu virzību uz pilnīgu rekursiju. Tomēr viens uzņēmums nevar izvēlēties apstāties pats par sevi. Ja viena laboratorija nospiež bremzes, kamēr citas turpina paātrināties, laboratorija, kas apstājās, zaudē savu nozīmi un spēju ietekmēt nozari.

Lai panāktu reālu palēninājumu, ir nepieciešams, lai vairākas labi nodrošinātas laboratorijas vairākās valstīs vienotos par vienādiem nosacījumiem pauzei. Tas ir grūti, jo MI nozare pašlaik ir decentralizēta konkurence. Tāpat kā neviena valsts nevēlas būt pirmā, kas pārtrauc izstrādāt progresīvus ieročus, neviens tehnoloģiju gigants nevēlas būt pirmais, kas ierobežo savas programmatūras izstrādes ātrumu. Rezultāts ir nestabila vide, kurā ātrums tiek prioritizēts pār spēju saglabāt cilvēka uzraudzību.

Kāpēc kontroles zaudēšana ir svarīga vidusmēra lietotājam

Ikdienas lietotājam ideja par MI, kas pats sevi būvē, var šķist tāla zinātnieku problēma. Tomēr zem pārsega šī maiņa rada taustāmu ietekmi uz to, kā mēs mijiedarbojamies ar tehnoloģijām. Kad cilvēks raksta kodu, pastāv loģikas pēdas, kurām cits cilvēks var sekot. Ja kods izraisa privātuma noplūdi vai aizspriedumainu lēmumu, izstrādātājs var atrast konkrēto koda rindiņu un to izlabot.

Kad MI izveido savu pēcteci, šī loģika kļūst necaurredzama. Mēs virzāmies tālāk "melnās kastes" problēmā, kur mašīna sniedz rezultātu, bet mums nav iespējas uzzināt, kā tā nonāca pie šāda secinājuma. Tas ietekmē visu — no tā, kā banka novērtē jūsu kredītreitingu, līdz tam, kā medicīniskais MI diagnosticē slimību. Ja sistēma pašuzlabojas bez uzraudzības, mēs nevaram garantēt, ka tajā neattīstās slēpti aizspriedumi vai neparedzama uzvedība, kas varētu kaitēt lietotājiem.

Tāpat pastāv arī drošības jautājums. Ja MI spēj pilnībā izveidot savus pēctečus, veidi, kā mēs nodrošinām un uzraugām šīs sistēmas, kļūst sarežģītāki. Pašuzlabojošs MI teorētiski varētu atrast un izmantot ievainojamības savā drošības sistēmā ātrāk, nekā cilvēku komanda spēj tās novērst. Būtībā mēs veidojam digitālu ekosistēmu, kas var attīstīties pati, potenciāli pāraugot mūsu izveidotos drošības tīklus.

Pāreja no radītāja uz uzraugu

Vēsturiski rūpniecības progress vienmēr ir ietvēris cilvēkus, kuri pārvalda rīkus. No tvaika dzinēja līdz montāžas līnijai — cilvēks vienmēr bija galīgā autoritāte mašīnas darbībā. MI pārtrauc šo vēsturisko ķēdi. Cilvēka lomai sašaurinoties, mūsu galvenais uzdevums mainās no programmatūras izstrādes uz vērošanu, kā programmatūra būvē pati sevi.

Šī pāreja prasa jaunu rīku kopumu caurskatāmībai. Paša Anthropic pētniecības institūts strādā pie sistēmām, lai pārbaudītu rekursīvā MI progresu, taču tehnoloģija attīstās ātrāk par regulējumu. No patērētāja viedokļa tas nozīmē, ka mēs ieejam laikmetā, kurā produkti, ko lietojam ikdienā, vairs nav tiešs cilvēka atjautības rezultāts. Tie ir mašīnas interpretācijas rezultāts par cilvēka vajadzībām.

Interesanti, ka tas nenozīmē, ka tehnoloģija kļūs mazāk noderīga. Faktiski rekursīvais MI, visticamāk, novedīs pie izrāvieniem veselības aprūpē un zinātnē, kas iepriekš nebija iespējami. Tas varētu atklāt jaunus materiālus akumulatoriem vai atrast efektīvākus veidus, kā pārvaldīt globālās piegādes ķēdes. Ieguvumi ir nepieredzēti, taču tie nāk ar sistēmisku risku, kuru nozare tikai sāk apzināt.

Orientēšanās pašuzlabojošā digitālajā pasaulē

Galvenā atziņa ir tāda, ka MI nozare tuvojas punktam, no kura vairs nav atgriešanās. Tiklīdz tehnoloģija būs spējīga uz 100% pašuzlabošanos, cilvēka spēja iejaukties kļūs ierobežota. Pašlaik mēs atrodamies īsā laika posmā, kad vēl varam izlemt, cik lielu kontroli vēlamies saglabāt.

Vidusmēra lietotājam labākais ceļš uz priekšu ir palikt vērīgam pret to, cik lielu autonomiju mēs piešķiram lietotnēm un pakalpojumiem, kurus izmantojam. Mums vajadzētu meklēt uzņēmumus, kas par prioritāti izvirza caurskatāmību un savu modeļu trešo pušu auditus. Izpratne par to, ka jūsu programmatūra tagad raksta pati savu scenāriju, ir pirmais solis, lai pieprasītu labāku uzraudzību no cilvēkiem, kuru rokās ir gāzes pedālis.

Galu galā mērķis nav apturēt progresu, bet gan nodrošināt, lai progress joprojām būtu saskaņots ar cilvēka drošību. MI sākot apmācīt MI, nepieciešamība pēc globālas vienošanās par bremžu pedāli kļūst steidzamāka. Mums ir jānodrošina, ka pat tad, ja darbu veic mašīna, cilvēks joprojām ir tas, kurš izlemj, kurp automašīna brauc.

Avoti: Anthropic, BBC World News, Jack Clark intervija.

#Anthropic #DžeksKlārks #MākslīgaisIntelekts #RekursīvāPašuzlabošanās #TehnoloģijuPārvaldība

Uz tikšanos otrā pusē.

Mūsu end-to-end šifrētais e-pasta un mākoņdatu glabāšanas risinājums nodrošina visefektīvākos līdzekļus drošai datu apmaiņai, garantējot jūsu datu drošību un konfidencialitāti.

/ Izveidot bezmaksas kontu

Pielāgotie domēni

Līdz 1 TB krātuve

Paplašinātā kopīgošana

End-To-End šifrēšana

Pašiznīcinoši e-pasti

Pielāgotie domēni

Līdz 1 TB krātuve

Paplašinātā kopīgošana

End-To-End šifrēšana

Pašiznīcinoši e-pasti

Beeble Mail

Beeble Drive

Par Beeble

Misija

Vēsture

Premium

Vispārīgie jautājumi

Ziedot

Kontakti