Nors vyraujantis naratyvas teigia, kad dirbtinis intelektas yra grynas mokslinio pagreičio variklis, realybė tampa vis sudėtingesnė. Mums buvo sakoma, kad didieji kalbos modeliai (LLM) veiks kaip nenuilstantys praktikantai, per kelias sekundes apibendrinantys didžiulius duomenų rinkinius ir rengiantys sudėtingus straipsnius, padėdami žmonėms įveikti vėžį ar įvaldyti termobruolinę sintezę. Tačiau svarbiausių pasaulio mokslinių tyrimų saugyklų koridoriuose tas praktikantas pradėjo meluoti savo gyvenimo aprašyme – ir vadovai galiausiai rodo jam duris.
„ArXiv“, gerbiama atvirosios prieigos saugykla, dešimtmečius priglaudžianti proveržio tyrimus fizikos, matematikos ir informatikos srityse, neseniai paskelbė griežtą naują politiką. Jei autorius pateikia darbą, kuriame yra „neginčijamų įrodymų“, kad jis leido dirbtiniam intelektui atlikti darbą nepatikrinęs rezultatų, jam gresia privalomas vienerių metų draudimas. Vidutiniam vartotojui tai gali atrodyti kaip vidinis akademinis ginčas. Tikrovėje tai yra pamatinė kova dėl informacijos vientisumo, kuri galiausiai daro įtaką viskam – nuo jūsų išmaniojo telefono baterijos veikimo laiko iki medicininių patarimų, kuriuos randate „Google“.
Norėdami suprasti, kodėl šis žingsnis yra toks trikdantis, pirmiausia turime pažvelgti, kas iš tikrųjų yra „ArXiv“. Tai nėra tradicinis žurnalas su lėtu, varginančiu tarpusavio peržiūros procesu. Vietoj to, tai yra išankstinių publikacijų (angl. preprint) serveris – vieta, kur tyrėjai nedelsdami paskelbia savo darbus, kad juos pamatytų pasaulinė bendruomenė. Tai skaitmeninė mokslo pasaulio žalia nafta; čia idėjos gryninamos prieš joms tampant produktais, kuriuos perkame. Jei „ArXiv“ šaltinio medžiaga bus užteršta „DI nuosėdomis“ (angl. AI slop), visa tolesnė žinių tiekimo grandinė pradės griūti.
Daugelį metų technologijų pasaulis aukštino LLM kaip didžiausią produktyvumo priemonę. Tačiau žvelgdami į bendrą vaizdą matome sisteminį pokytį, kai generavimo lengvumas viršija mūsų gebėjimą tikrinti. Tyrėjai, patiriantys didžiulį spaudimą „publikuotis arba žūti“, pradėjo naudoti DI ne tik kaip korektorių, bet ir kaip šešėlinį rašytoją. Problema? Šie DI modeliai iš esmės yra sudėtingi dėsningumų ieškotojai. Jie „nežino“ faktų; jie nuspėja kitą tikėtiną žodį sakinyje. Kai jie neturi fakto, jie dažnai išranda tokį, kuris skamba įtikinamai – šis reiškinys žinomas kaip haliucinacija.
Thomas Dietterichas, „ArXiv“ kompiuterių mokslo skyriaus pirmininkas, neseniai patikslino, kad saugykla visiškai nedraudžia naudoti DI. Vietoj to, jie draudžia neatsakingą jo naudojimą. Už žargono slypintys „neginčijami įrodymai“, apie kuriuos kalba Dietterichas, dažnai yra gėdingai akivaizdūs.
Kasdieniame gyvenime visi esame matę DI parašyto el. laiško požymius: perdėtai mandagų toną, bendrinę struktūrą arba retkarčiais tingaus siuntėjo paliktą frazę „Kaip DI kalbos modelis, aš negaliu...“. Didelės rizikos mokslinių tyrimų pasaulyje šios „raudonos vėliavėlės“ įgauna pavojingesnes formas:
Istoriškai mokslinis sukčiavimas reikalavo pastangų. Reikėdavo klastoti duomenis arba manipuliuoti vaizdais „Photoshop“ programa. Dabar sukurti įtikinamai atrodantį (bet visiškai suklastotą) mokslinį straipsnį užtrunka trumpiau nei užsisakyti picą. Štai kodėl „ArXiv“ pereina prie „vieno bandymo“ taisyklės. Jei moderatoriai ras aiškių įrodymų, kad jūs net nepasivarginote perskaityti savo paties DI sugeneruoto darbo, būsite pašalinti.
Pagal naująsias taisykles pasekmės yra griežtos. Vienerių metų draudimas naudotis „ArXiv“ yra didelis smūgis tyrėjo karjerai, ypač sparčiai besivystančiose srityse, tokiose kaip DI tyrimai, kur būti pirmam paskelbusiam yra viskas. Tačiau bausmė nesibaigia po dvylikos mėnesių. Panaikinus draudimą, bet kokios vėlesnės tų autorių publikacijos pirmiausia turi būti priimtos reputaciją turinčioje, recenzuojamoje platformoje, kad galėtų pasirodyti „ArXiv“.
Iš esmės „ArXiv“ sako: Jei negalime pasitikėti, kad būsite savo paties redaktorius, mes šį pasitikėjimą patikėsime kam nors kitam.
| Funkcija | Žmogaus vadovaujami tyrimai | Nepatikrinta DI generacija |
|---|---|---|
| Tikslumas | Didelis (gali pasitaikyti žmogaus klaidų) | Kintantis (linkęs į haliucinacijas) |
| Nuorodos | Tikros ir patikrinamos | Dažnai sugalvotos arba klaidingai priskirtos |
| Tonas | Konkretus ir techninis | Bendrinis ir pasikartojantis |
| Atsakomybė | Autorius prisiima visą atsakomybę | Atsakomybė dažnai yra neaiški |
| Peržiūros greitis | Lėtas ir metodiškas | Momentinis |
Įdomu tai, kad šis sugriežtinimas sutampa su dideliu struktūriniu saugyklos pokyčiu. Daugiau nei 20 metų priklausęs Kornelio universitetui, „ArXiv“ tampa nepriklausoma ne pelno siekiančia organizacija. Žvelgiant iš rinkos pusės, tai strateginis žingsnis siekiant atsparumo. Kaip nepriklausomas subjektas, „ArXiv“ gali pritraukti įvairesnį finansavimą, kad sukurtų automatizuotus įrankius ir pasamdytų žmones moderatorius, reikalingus kovai su kylančia DI sugeneruotos dezinformacijos banga.
Vartotojo požiūriu, turėtume tai vertinti kaip būtiną infrastruktūros atnaujinimą. Jei „ArXiv“ būtų užtvindytas nekokybišku turiniu, jis taptų nestabilia aplinka investuotojams ir technologijų įmonėms, kurios remiasi jo duomenimis kurdamos naujos kartos prietaisus. Susitvarkydamas, „ArXiv“ saugo pamatinį technologijų pramonės sluoksnį.
Kitaip tariant, kodėl paprastas žmogus – tas, kuris nerašo straipsnių apie kvantinę topologiją – turėtų tuo rūpintis? Todėl, kad mokslas nelieka tik laboratorijoje.
Kai „ArXiv“ paskelbiamas „proveržio“ straipsnis, jis dažnai sukelia naujienų straipsnių bangą. Jei tas straipsnis buvo haliucinuotas DI ir niekada nepatikrintas žmogaus autoriaus, ši dezinformacija keliauja per naujienų ciklą ir galiausiai patenka į jūsų socialinių tinklų srautą. Biomedicininių tyrimų srityje jau matėme atvejų, kai suklastotų citatų skaičius auga. Jei gydytojas ar politikos formuotojas remiasi tyrimų, kurie niekada nebuvo atlikti, santrauka, pasekmės realiame pasaulyje yra apčiuopiamos ir pavojingos.
Galiausiai „ArXiv“ žingsnis yra priminimas, kad decentralizuotos informacijos pasaulyje žmogaus elementas išlieka svarbiausiu filtru. DI yra galingas įrankis rezultatų apimčiai didinti, tačiau jis negali padidinti tiesos kiekio. Tiesai reikia lėto, metodiško žmogaus tikrinimo darbo.
Stebint besikeičiantį skaitmeninės informacijos kraštovaizdį, naujoji „ArXiv“ politika siūlo keletą pamokų mūsų pačių skaitmeniniams įpročiams. Žengiame į erą, kai turinio kūrimo kaina lygi nuliui, o tai reiškia, kad to turinio vertė taip pat artėja prie nulio – nebent už jo stovi patikimas žmogus ar institucija.
Praktiškai kalbant, visi turėtume pradėti taikyti „ArXiv filtrą“ vartojamai informacijai. Jei naujiena atrodo per daug tobulai sukonstruota, naudojama pernelyg bendrinė kalba arba cituojami „tyrimai“, kurių negalite rasti greitai paieškoję, vertinkite ją su tokiu pat skepticizmu, su kokiu „ArXiv“ moderatoriai vertina įtartiną išankstinę publikaciją.
Žvelgiant į bendrą vaizdą, „vieno bandymo“ taisyklė skirta ne tik tingiems mokslininkams bausti. Tai skirta išsaugoti erdvę, kurioje galima keistis idėjomis nebijant būti nuskandintam skaitmeninio triukšmo. DI toliau tvindant internetą turiniu, vertingiausias išteklius pasaulyje bus ne duomenys ar skaičiavimo galia, o pasitikėjimas.
Šaltiniai:



Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.
/ Sukurti nemokamą paskyrą