Privatumo principai

Anonimiškumo pabaiga? Kaip DI dabar susieja jūsų slaptas paskyras su tikrąja tapatybe

Nauji tyrimai atskleidžia, kaip DI ir didieji kalbos modeliai, tokie kaip „ChatGPT“, gali nustatyti anoniminius socialinių tinklų vartotojus analizuodami lingvistinius dėsningumus ir asmenines išvadas.
Anonimiškumo pabaiga? Kaip DI dabar susieja jūsų slaptas paskyras su tikrąja tapatybe

Dešimtmečius internetas žadėjo galimybę pradėti viską iš naujo. Galėjote būti profesionalas „LinkedIn“ tinkle, hobio entuziastas „Reddit“ ir politikos komentatorius „X“ platformoje, kartu išlaikydami šiuos pasaulius griežtai atskirtus. Tačiau didžiųjų kalbos modelių (LLM) proveržis šią pertvarą pavertė tiesiog tinklinėmis durimis. Nauji tyrimai patvirtina, kad ta pati technologija, kuri valdo „ChatGPT“ ir „Claude“, dabar naudojama kaip įrankis, leidžiantis stulbinančiu tikslumu nuplėšti internetinio anonimiškumo kaukę.

Skaitmeninis pirštų atspaudas, kurio nežinojote turintys

Esame pripratę prie sekimo slapukų ir IP adresų idėjos, tačiau DI pagrįstas deanonimizavimas veikia daug gilesniu lygmeniu: per jūsų balsą. Kiekvieną kartą rašydami įrašą, paliekate unikalų lingvistinį parašą. Tai apima jūsų retų būdvardžių pasirinkimą, specifinius gramatinius ypatumus ir net tai, kaip struktūruojate paprastą skundą dėl oro sąlygų.

Tyrėjai nustatė, kad LLM modeliai yra išskirtinai gabūs „stilometrijai“ – lingvistinio stiliaus tyrimui. Mokydamasis iš žinomo jūsų rašymo pavyzdžio (pavyzdžiui, viešo tinklaraščio ar profesionalaus profilio), DI gali nuskaityti milijonus anoniminių įrašų internete, kad rastų atitikmenį. Jis ieško ne tik to, ką sakote, bet ir kaip tai sakote. Ši galimybė iš aukšto lygio kriminalistikos srities persikėlė į rankas bet kam, kas turi API raktą ir bazinį supratimą apie užklausų inžineriją (prompt engineering).

Kaip veikia išvadų ataka

Naujausiuose bandymų scenarijuose tyrėjai naudojo tokius modelius kaip „GPT-4“, kad atliktų „išvadų atakas“ (inference attacks). Priešingai nei tradicinis įsilaužimas, reikalaujantis įsilaužti į duomenų bazę, išvadų ataka tiesiog sujungia viešai prieinamos informacijos taškus.

Pavyzdžiui, anoniminis vartotojas viename įraše gali paminėti konkrečią vietinę kavos parduotuvę, kitame – specifinę programinės įrangos klaidą, o trečiame – tam tikrą šunų veislę. Nors nė viena iš šių detalių neidentifikuoja asmens atskirai, DI gali susintetinti šiuos duomenis. Kryžmiškai palyginęs šį „profilį“ su viešais įrašais ar kitomis socialinės žiniasklaidos platformomis, DI gali susiaurinti milijonų žmonių ratą iki vieno asmens su didesniu nei 90 % tikslumu kontroliuojamose aplinkose.

Pokytis nuo metaduomenų prie prasmės

Istoriškai privatumo gynėjai patardavo vartotojams šalinti metaduomenis – paslėptus laiko spaudus ir vietos žymas, pridedamas prie nuotraukų. Nors tai išlieka geras patarimas, jo nebeužtenka. DI nereikia metaduomenų; jis supranta kontekstą.

Jei antradienio rytą paskelbiate apie konkretų vėlavimą važiuojant į darbą, o penktadienį paminite konkretaus biurų pastato kavinę, DI sukuria geografinį ir laiko žemėlapį apie jūsų gyvenimą. Šį „semantinį pirštų atspaudų nuėmimą“ yra daug sunkiau paslėpti, nes jis yra įaugęs į patį mūsų bendravimo būdą. Mes iš esmės nutekiname savo tapatybę per savo kasdienio gyvenimo kontekstą.

Tikrojo pasaulio deanonimizavimo rizika

Tai nėra tik teorinis susirūpinimas privatumo entuziastams. Pasekmės saugumui realiame pasaulyje yra didžiulės:

  • Tikslinis priekabiavimas ir doksingas: Piktavaliai gali identifikuoti kritikus ar pranešėjus, kurie manė esantys saugūs po pseudonimu.
  • Įmonių sekimas: Įmonės gali identifikuoti darbuotojus, kurie anonimiškai rašo apie darbo sąlygas arba ieško naujo darbo.
  • Valstybinio lygio sekimas: Režimuose su griežta cenzūra DI įrankiai gali būti naudojami susieti disidentų paskyras su fiziniais adresais, o tai gali sukelti tiesiogines teisines ar fizines pasekmes.
  • Sudėtingas fisingas: Kai hakeris susieja jūsų anoniminius interesus su jūsų tikrąja tapatybe, jis gali sukurti itin asmeniškas apgaules, kurias beveik neįmanoma atskirti nuo teisėto bendravimo.

Ar galime susigrąžinti savo privatumą?

DI modeliams tampant vis sudėtingesniems, „katės ir pelės“ žaidimas dėl privatumo vidutiniam vartotojui tampa vis sunkesnis. Tačiau yra praktinių žingsnių, kaip sumažinti riziką būti susietam per skirtingas platformas.

Strategija Metodas Efektyvumas
Stiliaus keitimas Sąmoningas tono, žargono ir gramatikos keitimas skirtingose paskyrose. Vidutinis
Kompartmentalizacija Konkrečių vietų, darbdavių ar unikalių gyvenimo įvykių neminėjimas anoniminėse paskyrose. Aukštas
DI parafrazavimas Teksto praleidimas per kitą DI, kad „neutralizuotumėte“ savo rašymo stilių prieš skelbiant. Aukštas
Duomenų minimizavimas Senų paskyrų ir įrašų, kuriuose yra daug asmeninės informacijos, trynimas. Vidutinis

Praktiniai patarimai šiuolaikiniam vartotojui

Jei dėl jautrių priežasčių naudojate anonimines paskyras, laikas atlikti saviauditą. Pradėkite nuo prielaidos, kad viskas, ką rašote, gali būti atsekta iki jūsų, jei motyvuotas veikėjas naudos DI įrankius.

  1. Audituokite savo „unikalius identifikatorius“: Ar naudojate tą patį unikalų vartotojo vardą arba jo variaciją skirtingose svetainėse? Nedelsdami juos pakeiskite.
  2. Būkite abstraktūs: Aptardami savo gyvenimą, kalbėkite bendrai. Užuot sakę „kepykla 5-ojoje gatvėje“, sakykite „vietinė parduotuvė“.
  3. Naudokite „vienkartinius“ rašymo stilius: Labai jautriems įrašams stenkitės rašyti taip, kaip jums nebūdinga. Naudokite trumpesnius sakinius, kitokius skyrybos įpročius arba net išverskite tekstą į kitą kalbą ir atgal, kad pašalintumėte savo asmeninį ritmą.
  4. Ribokite kryžminį skelbimą: Venkite dalintis ta pačia nuotrauka ar tuo pačiu pokštu keliose platformose, nes tai yra lengvi „inkarai“, prie kurių DI gali prisikabinti.

Anoniminio žiniatinklio ateitis

Žengiame į erą, kurioje privatumas nebėra numatytoji interneto būsena; tai funkcija, kurią reikia aktyviai kurti. LLM modeliams vis labiau integruojantis į paieškos sistemas ir socialinės žiniasklaidos moderavimo įrankius, norint išlikti tikrai anonimiškam, reikės daugiau nei tik netikro vardo. Reikės sąmoningų pastangų paslėpti pačius mąstymo ir kalbos modelius, kurie daro mus individais. Šis tyrimas tarnauja kaip perspėjimas: DI amžiuje jūsų žodžiai identifikuoja jus taip pat tiksliai kaip jūsų DNR.

Šaltiniai

  • ETH Zurich: Beyond Memorization: Violating Privacy via Inference with Large Language Models
  • Journal of Cybersecurity: Stylometry and the Risk of De-anonymization
  • Privacy Affairs: AI and the End of Online Pseudonyms
bg
bg
bg

Iki pasimatymo kitoje pusėje.

Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.

/ Sukurti nemokamą paskyrą