Taču, mums arvien vairāk ieejot ģeneratīvā MI laikmetā, šī "operācija" ir kļuvusi bezgalīgi sarežģītāka. Šodien mūsu dati netiek glabāti tikai rindās un kolonnās; tie ir ieausti lielo valodu modeļu (LLM) statistiskajā audumā. Kad modelis "iemācās" jūsu seju, rakstīšanas stilu vai personīgo vēsturi, tas nesaglabā failu. Tas pielāgo miljardiem matemātisko svaru. Šī pāreja no statiskas krātuves uz varbūtisko atmiņu ir radījusi fundamentālu saspīlējumu starp cilvēktiesībām un mašīnu arhitektūru.
Lai saprastu, kāpēc "atcelšana" ir tik sarežģīta, iedomājieties tradicionālu datubāzi kā dokumentu skapi. Ja vēlaties izņemt dokumentu, jūs vienkārši izvelkat mapi un sasmalcināt to. Pārējais skapis paliek neskarts.
Ģeneratīvais MI darbojas vairāk kā milzīgs zupas katls. Katrs apmācībā izmantotais datu elements ir sastāvdaļa, kas iemaisīta buljonā. Jūs nevarat vienkārši iebāzt roku gatavā minestronē un izvilkt sāli vai konkrētu piparu graudu, nemainot visas porcijas garšu. Lielajos valodu modeļos jūsu personīgie dati ir izkliedēti pa visu neironu tīklu. Tā kā šie parametri ir savstarpēji atkarīgi, vienas konkrētas personas ietekmes noņemšanai bieži vien ir nepieciešama modeļa atkārtota apmācība no nulles — process, kas izmaksā miljoniem dolāru un prasa mēnešiem ilgu skaitļošanas laiku.
Regulatori arvien mazāk tiecas pieņemt argumentu "tas ir pārāk grūti" kā tehnisku attaisnojumu. Saskaņā ar VDAR (GDPR) Eiropā un CCPA Kalifornijā, tiesības uz dzēšanu ir tehnoloģiski neitrālas. Ja modelis var halucinēt jūsu mājas adresi vai reproducēt jūsu privāto saraksti, šis modelis tehniski apstrādā jūsu datus.
Mēs novērojam maiņu tajā, kā tiesas raugās uz "datu valdīšanu". Runa vairs nav tikai par to, kur atrodas fails, bet gan par to, kā sistēma uzvedas. Ja MI var rekonstruēt sensitīvu informāciju, izmantojot "piederības secināšanas uzbrukumus" (membership inference attacks) — kur hakeris zondē modeli, lai redzētu, vai konkrēti dati ir bijuši tā apmācības kopas sastāvdaļa —, tad privātuma risks ir reāls, neatkarīgi no tā, vai neapstrādātie dati ir izdzēsti no apmācības serveriem.
Reaģējot uz to, ir parādījusies jauna pētniecības joma, ko sauc par "mašīnmācīšanās atcelšanu" (Machine Unlearning). Mērķis ir izstrādāt algoritmus, kas var atņemt konkrētu datu punktu ietekmi, neiznīcinot modeļa kopējo lietderību.
| Metode | Kā tā darbojas | Plusi | Mīnusi |
|---|---|---|---|
| SISA (Sadalīšana) | Apmāca modeli mazos, izolētos fragmentos. | Vieglāk pārkvalificēt tikai vienu fragmentu. | Liela krātuves pieskaitāmā vērtība. |
| Gradientu tīrīšana | Atceļ optimizācijas soļus konkrētiem datiem. | Ātrāk nekā pilna atkārtota apmācība. | Var pasliktināt kopējo precizitāti. |
| Ietekmes funkcijas | Identificē, kuri neironi "atceras" mērķa datus. | Ļoti mērķtiecīga. | Skaitļošanas ziņā dārga lieliem modeļiem. |
| Diferenciālais privātums | Apmācības laikā pievieno matemātisku troksni. | Novērš datu apgūšanu. | Var padarīt modeli mazāk "gudru". |
Tiesības uz atcelšanu ir kas vairāk nekā tikai privātums; tās ir tiesības attīstīties. Ja MI modelis pastāvīgi iesaldē jūsu versiju, pamatojoties uz jūsu datiem pirms pieciem gadiem, tas liedz jums iespēju tikt pāri savām kļūdām vai mainīt savu publisko tēlu. Pasaulē, kur MI vadītas pagātnes pārbaudes un automatizētas reputācijas sistēmas kļūst par normu, mašīnas nespēja aizmirst kļūst par digitālās bagāžas mūža ieslodzījumu.
Kamēr mēs virzāmies cauri šai pārejai, gan izstrādātājiem, gan datu subjektiem ir jāpieņem jaunas stratēģijas digitālo pēdu pārvaldībai MI laikmetā.
Izstrādātājiem un uzņēmumiem:
Privātpersonām:
Ģeneratīvo sistēmu saskaņošana ar cilvēktiesībām prasa maiņu tajā, kā mēs veidojam tehnoloģijas. Mēs nevaram uztvert MI kā neapturamu dabas spēku; tas ir cilvēku radīts rīks, un tam jāpaliek pakārtotam cilvēka cieņai. Tiesības uz atcelšanu ir pirmais solis, lai nodrošinātu, ka, lai gan mašīnām var būt bezgalīga atmiņa, tām nav pēdējais vārds par to, kas mēs esam.



Mūsu end-to-end šifrētais e-pasta un mākoņdatu glabāšanas risinājums nodrošina visefektīvākos līdzekļus drošai datu apmaiņai, garantējot jūsu datu drošību un konfidencialitāti.
/ Izveidot bezmaksas kontu