Pramonės naujienos

Svarbiausia pasaulio mokslo svetainė dabar kovoja su savo pačios didžiausia tendencija

„ArXiv“ įveda „vieno bandymo“ taisyklę, kad uždraustų tyrėjams naudoti nepatikrintą DI straipsniuose. Sužinokite, kodėl tai svarbu mokslui ir jūsų skaitmeninei ateičiai.

Rahul Mehta

2026 m. gegužės 18 d.

Svarbiausia pasaulio mokslo svetainė dabar kovoja su savo pačios didžiausia tendencija

Nors vyraujantis naratyvas teigia, kad dirbtinis intelektas yra grynas mokslinio pagreičio variklis, realybė tampa vis sudėtingesnė. Mums buvo sakoma, kad didieji kalbos modeliai (LLM) veiks kaip nenuilstantys praktikantai, per kelias sekundes apibendrinantys didžiulius duomenų rinkinius ir rengiantys sudėtingus straipsnius, padėdami žmonėms įveikti vėžį ar įvaldyti termobruolinę sintezę. Tačiau svarbiausių pasaulio mokslinių tyrimų saugyklų koridoriuose tas praktikantas pradėjo meluoti savo gyvenimo aprašyme – ir vadovai galiausiai rodo jam duris.

„ArXiv“, gerbiama atvirosios prieigos saugykla, dešimtmečius priglaudžianti proveržio tyrimus fizikos, matematikos ir informatikos srityse, neseniai paskelbė griežtą naują politiką. Jei autorius pateikia darbą, kuriame yra „neginčijamų įrodymų“, kad jis leido dirbtiniam intelektui atlikti darbą nepatikrinęs rezultatų, jam gresia privalomas vienerių metų draudimas. Vidutiniam vartotojui tai gali atrodyti kaip vidinis akademinis ginčas. Tikrovėje tai yra pamatinė kova dėl informacijos vientisumo, kuri galiausiai daro įtaką viskam – nuo jūsų išmaniojo telefono baterijos veikimo laiko iki medicininių patarimų, kuriuos randate „Google“.

Automatizuoto genijaus mitas

Norėdami suprasti, kodėl šis žingsnis yra toks trikdantis, pirmiausia turime pažvelgti, kas iš tikrųjų yra „ArXiv“. Tai nėra tradicinis žurnalas su lėtu, varginančiu tarpusavio peržiūros procesu. Vietoj to, tai yra išankstinių publikacijų (angl. preprint) serveris – vieta, kur tyrėjai nedelsdami paskelbia savo darbus, kad juos pamatytų pasaulinė bendruomenė. Tai skaitmeninė mokslo pasaulio žalia nafta; čia idėjos gryninamos prieš joms tampant produktais, kuriuos perkame. Jei „ArXiv“ šaltinio medžiaga bus užteršta „DI nuosėdomis“ (angl. AI slop), visa tolesnė žinių tiekimo grandinė pradės griūti.

Daugelį metų technologijų pasaulis aukštino LLM kaip didžiausią produktyvumo priemonę. Tačiau žvelgdami į bendrą vaizdą matome sisteminį pokytį, kai generavimo lengvumas viršija mūsų gebėjimą tikrinti. Tyrėjai, patiriantys didžiulį spaudimą „publikuotis arba žūti“, pradėjo naudoti DI ne tik kaip korektorių, bet ir kaip šešėlinį rašytoją. Problema? Šie DI modeliai iš esmės yra sudėtingi dėsningumų ieškotojai. Jie „nežino“ faktų; jie nuspėja kitą tikėtiną žodį sakinyje. Kai jie neturi fakto, jie dažnai išranda tokį, kuris skamba įtikinamai – šis reiškinys žinomas kaip haliucinacija.

Kai praktikantas pradeda išgalvoti dalykus

Thomas Dietterichas, „ArXiv“ kompiuterių mokslo skyriaus pirmininkas, neseniai patikslino, kad saugykla visiškai nedraudžia naudoti DI. Vietoj to, jie draudžia neatsakingą jo naudojimą. Už žargono slypintys „neginčijami įrodymai“, apie kuriuos kalba Dietterichas, dažnai yra gėdingai akivaizdūs.

Kasdieniame gyvenime visi esame matę DI parašyto el. laiško požymius: perdėtai mandagų toną, bendrinę struktūrą arba retkarčiais tingaus siuntėjo paliktą frazę „Kaip DI kalbos modelis, aš negaliu...“. Didelės rizikos mokslinių tyrimų pasaulyje šios „raudonos vėliavėlės“ įgauna pavojingesnes formas:

Haliucinuotos nuorodos: DI cituoja straipsnį, kuris skamba tikroviškai, parašytą tikro profesoriaus, tačiau tas straipsnis tiesiog neegzistuoja.
Vidinės užklausos: Autoriai netyčia palieka savo instrukcijas dirbtiniam intelektui (pvz., „Parašyk šių duomenų išvadą“) galutiniame PDF faile.
Šališka duomenų sintezė: DI modeliai kartoja pasenusias ar neteisingas mokslines dogmas, nes buvo apmokyti naudojant senesnius interneto duomenis.

Istoriškai mokslinis sukčiavimas reikalavo pastangų. Reikėdavo klastoti duomenis arba manipuliuoti vaizdais „Photoshop“ programa. Dabar sukurti įtikinamai atrodantį (bet visiškai suklastotą) mokslinį straipsnį užtrunka trumpiau nei užsisakyti picą. Štai kodėl „ArXiv“ pereina prie „vieno bandymo“ taisyklės. Jei moderatoriai ras aiškių įrodymų, kad jūs net nepasivarginote perskaityti savo paties DI sugeneruoto darbo, būsite pašalinti.

Vienerių metų baudos suolas

Pagal naująsias taisykles pasekmės yra griežtos. Vienerių metų draudimas naudotis „ArXiv“ yra didelis smūgis tyrėjo karjerai, ypač sparčiai besivystančiose srityse, tokiose kaip DI tyrimai, kur būti pirmam paskelbusiam yra viskas. Tačiau bausmė nesibaigia po dvylikos mėnesių. Panaikinus draudimą, bet kokios vėlesnės tų autorių publikacijos pirmiausia turi būti priimtos reputaciją turinčioje, recenzuojamoje platformoje, kad galėtų pasirodyti „ArXiv“.

Iš esmės „ArXiv“ sako: Jei negalime pasitikėti, kad būsite savo paties redaktorius, mes šį pasitikėjimą patikėsime kam nors kitam.

Funkcija	Žmogaus vadovaujami tyrimai	Nepatikrinta DI generacija
Tikslumas	Didelis (gali pasitaikyti žmogaus klaidų)	Kintantis (linkęs į haliucinacijas)
Nuorodos	Tikros ir patikrinamos	Dažnai sugalvotos arba klaidingai priskirtos
Tonas	Konkretus ir techninis	Bendrinis ir pasikartojantis
Atsakomybė	Autorius prisiima visą atsakomybę	Atsakomybė dažnai yra neaiški
Peržiūros greitis	Lėtas ir metodiškas	Momentinis

Atsiskyrimas nuo dramblio kaulo bokšto

Įdomu tai, kad šis sugriežtinimas sutampa su dideliu struktūriniu saugyklos pokyčiu. Daugiau nei 20 metų priklausęs Kornelio universitetui, „ArXiv“ tampa nepriklausoma ne pelno siekiančia organizacija. Žvelgiant iš rinkos pusės, tai strateginis žingsnis siekiant atsparumo. Kaip nepriklausomas subjektas, „ArXiv“ gali pritraukti įvairesnį finansavimą, kad sukurtų automatizuotus įrankius ir pasamdytų žmones moderatorius, reikalingus kovai su kylančia DI sugeneruotos dezinformacijos banga.

Vartotojo požiūriu, turėtume tai vertinti kaip būtiną infrastruktūros atnaujinimą. Jei „ArXiv“ būtų užtvindytas nekokybišku turiniu, jis taptų nestabilia aplinka investuotojams ir technologijų įmonėms, kurios remiasi jo duomenimis kurdamos naujos kartos prietaisus. Susitvarkydamas, „ArXiv“ saugo pamatinį technologijų pramonės sluoksnį.

Kodėl jūsų naujienų srautas priklauso nuo matematikos svetainės

Kitaip tariant, kodėl paprastas žmogus – tas, kuris nerašo straipsnių apie kvantinę topologiją – turėtų tuo rūpintis? Todėl, kad mokslas nelieka tik laboratorijoje.

Kai „ArXiv“ paskelbiamas „proveržio“ straipsnis, jis dažnai sukelia naujienų straipsnių bangą. Jei tas straipsnis buvo haliucinuotas DI ir niekada nepatikrintas žmogaus autoriaus, ši dezinformacija keliauja per naujienų ciklą ir galiausiai patenka į jūsų socialinių tinklų srautą. Biomedicininių tyrimų srityje jau matėme atvejų, kai suklastotų citatų skaičius auga. Jei gydytojas ar politikos formuotojas remiasi tyrimų, kurie niekada nebuvo atlikti, santrauka, pasekmės realiame pasaulyje yra apčiuopiamos ir pavojingos.

Galiausiai „ArXiv“ žingsnis yra priminimas, kad decentralizuotos informacijos pasaulyje žmogaus elementas išlieka svarbiausiu filtru. DI yra galingas įrankis rezultatų apimčiai didinti, tačiau jis negali padidinti tiesos kiekio. Tiesai reikia lėto, metodiško žmogaus tikrinimo darbo.

Signalo atskyrimas nuo triukšmo

Stebint besikeičiantį skaitmeninės informacijos kraštovaizdį, naujoji „ArXiv“ politika siūlo keletą pamokų mūsų pačių skaitmeniniams įpročiams. Žengiame į erą, kai turinio kūrimo kaina lygi nuliui, o tai reiškia, kad to turinio vertė taip pat artėja prie nulio – nebent už jo stovi patikimas žmogus ar institucija.

Praktiškai kalbant, visi turėtume pradėti taikyti „ArXiv filtrą“ vartojamai informacijai. Jei naujiena atrodo per daug tobulai sukonstruota, naudojama pernelyg bendrinė kalba arba cituojami „tyrimai“, kurių negalite rasti greitai paieškoję, vertinkite ją su tokiu pat skepticizmu, su kokiu „ArXiv“ moderatoriai vertina įtartiną išankstinę publikaciją.

Žvelgiant į bendrą vaizdą, „vieno bandymo“ taisyklė skirta ne tik tingiems mokslininkams bausti. Tai skirta išsaugoti erdvę, kurioje galima keistis idėjomis nebijant būti nuskandintam skaitmeninio triukšmo. DI toliau tvindant internetą turiniu, vertingiausias išteklius pasaulyje bus ne duomenys ar skaičiavimo galia, o pasitikėjimas.

Šaltiniai:

ArXiv oficialūs valdymo ir politikos atnaujinimai (2024–2026 m.)
„404 Media“ interviu su Thomas Dietterich
Kornelio universiteto bibliotekos administracinės ataskaitos
Recenzuojami tyrimai apie LLM generuojamas citatų haliucinacijas

#ArXiv #DidiejiKalbosModeliai #DirbtinisIntelektas #MoksliniaiTyrimai #TechnologijųEtika

Iki pasimatymo kitoje pusėje.

Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.

/ Sukurti nemokamą paskyrą

Pasirinktiniai domenai

Iki 1 TB talpos saugykla

Išplėstinis bendrinimas

Galutinis šifravimas

Savaime susinaikinantys el. laiškai

Pasirinktiniai domenai

Iki 1 TB talpos saugykla

Išplėstinis bendrinimas

Galutinis šifravimas

Savaime susinaikinantys el. laiškai

Beeble Mail

Beeble Drive

Apie Beeble

Misija

Istorija

Premium

Bendrieji klausimai

Paaukoti

Kontaktai