Dešimtmečius internetas žadėjo galimybę pradėti viską iš naujo. Galėjote būti profesionalas „LinkedIn“ tinkle, hobio entuziastas „Reddit“ ir politikos komentatorius „X“ platformoje, kartu išlaikydami šiuos pasaulius griežtai atskirtus. Tačiau didžiųjų kalbos modelių (LLM) proveržis šią pertvarą pavertė tiesiog tinklinėmis durimis. Nauji tyrimai patvirtina, kad ta pati technologija, kuri valdo „ChatGPT“ ir „Claude“, dabar naudojama kaip įrankis, leidžiantis stulbinančiu tikslumu nuplėšti internetinio anonimiškumo kaukę.
Esame pripratę prie sekimo slapukų ir IP adresų idėjos, tačiau DI pagrįstas deanonimizavimas veikia daug gilesniu lygmeniu: per jūsų balsą. Kiekvieną kartą rašydami įrašą, paliekate unikalų lingvistinį parašą. Tai apima jūsų retų būdvardžių pasirinkimą, specifinius gramatinius ypatumus ir net tai, kaip struktūruojate paprastą skundą dėl oro sąlygų.
Tyrėjai nustatė, kad LLM modeliai yra išskirtinai gabūs „stilometrijai“ – lingvistinio stiliaus tyrimui. Mokydamasis iš žinomo jūsų rašymo pavyzdžio (pavyzdžiui, viešo tinklaraščio ar profesionalaus profilio), DI gali nuskaityti milijonus anoniminių įrašų internete, kad rastų atitikmenį. Jis ieško ne tik to, ką sakote, bet ir kaip tai sakote. Ši galimybė iš aukšto lygio kriminalistikos srities persikėlė į rankas bet kam, kas turi API raktą ir bazinį supratimą apie užklausų inžineriją (prompt engineering).
Naujausiuose bandymų scenarijuose tyrėjai naudojo tokius modelius kaip „GPT-4“, kad atliktų „išvadų atakas“ (inference attacks). Priešingai nei tradicinis įsilaužimas, reikalaujantis įsilaužti į duomenų bazę, išvadų ataka tiesiog sujungia viešai prieinamos informacijos taškus.
Pavyzdžiui, anoniminis vartotojas viename įraše gali paminėti konkrečią vietinę kavos parduotuvę, kitame – specifinę programinės įrangos klaidą, o trečiame – tam tikrą šunų veislę. Nors nė viena iš šių detalių neidentifikuoja asmens atskirai, DI gali susintetinti šiuos duomenis. Kryžmiškai palyginęs šį „profilį“ su viešais įrašais ar kitomis socialinės žiniasklaidos platformomis, DI gali susiaurinti milijonų žmonių ratą iki vieno asmens su didesniu nei 90 % tikslumu kontroliuojamose aplinkose.
Istoriškai privatumo gynėjai patardavo vartotojams šalinti metaduomenis – paslėptus laiko spaudus ir vietos žymas, pridedamas prie nuotraukų. Nors tai išlieka geras patarimas, jo nebeužtenka. DI nereikia metaduomenų; jis supranta kontekstą.
Jei antradienio rytą paskelbiate apie konkretų vėlavimą važiuojant į darbą, o penktadienį paminite konkretaus biurų pastato kavinę, DI sukuria geografinį ir laiko žemėlapį apie jūsų gyvenimą. Šį „semantinį pirštų atspaudų nuėmimą“ yra daug sunkiau paslėpti, nes jis yra įaugęs į patį mūsų bendravimo būdą. Mes iš esmės nutekiname savo tapatybę per savo kasdienio gyvenimo kontekstą.
Tai nėra tik teorinis susirūpinimas privatumo entuziastams. Pasekmės saugumui realiame pasaulyje yra didžiulės:
DI modeliams tampant vis sudėtingesniems, „katės ir pelės“ žaidimas dėl privatumo vidutiniam vartotojui tampa vis sunkesnis. Tačiau yra praktinių žingsnių, kaip sumažinti riziką būti susietam per skirtingas platformas.
| Strategija | Metodas | Efektyvumas |
|---|---|---|
| Stiliaus keitimas | Sąmoningas tono, žargono ir gramatikos keitimas skirtingose paskyrose. | Vidutinis |
| Kompartmentalizacija | Konkrečių vietų, darbdavių ar unikalių gyvenimo įvykių neminėjimas anoniminėse paskyrose. | Aukštas |
| DI parafrazavimas | Teksto praleidimas per kitą DI, kad „neutralizuotumėte“ savo rašymo stilių prieš skelbiant. | Aukštas |
| Duomenų minimizavimas | Senų paskyrų ir įrašų, kuriuose yra daug asmeninės informacijos, trynimas. | Vidutinis |
Jei dėl jautrių priežasčių naudojate anonimines paskyras, laikas atlikti saviauditą. Pradėkite nuo prielaidos, kad viskas, ką rašote, gali būti atsekta iki jūsų, jei motyvuotas veikėjas naudos DI įrankius.
Žengiame į erą, kurioje privatumas nebėra numatytoji interneto būsena; tai funkcija, kurią reikia aktyviai kurti. LLM modeliams vis labiau integruojantis į paieškos sistemas ir socialinės žiniasklaidos moderavimo įrankius, norint išlikti tikrai anonimiškam, reikės daugiau nei tik netikro vardo. Reikės sąmoningų pastangų paslėpti pačius mąstymo ir kalbos modelius, kurie daro mus individais. Šis tyrimas tarnauja kaip perspėjimas: DI amžiuje jūsų žodžiai identifikuoja jus taip pat tiksliai kaip jūsų DNR.



Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.
/ Sukurti nemokamą paskyrą