Tööstusuudised

Maailma tähtsaim teadussait peab nüüd sõda omaenda suurima trendi vastu

ArXiv kehtestab "ühe eksimuse" reegli, et keelata teadlased, kes kasutavad artiklites kontrollimatut tehisintellekti. Loe, miks see on oluline teaduse ja digitaalse tuleviku jaoks.

Rahul Mehta

18. mai 2026

Maailma tähtsaim teadussait peab nüüd sõda omaenda suurima trendi vastu

Kuigi valdav narratiiv viitab sellele, et tehisintellekt on puhas teadusliku kiirenduse mootor, muutub tegelikkus kohapeal üha segasemaks. Meile on öeldud, et suured keelemudelid (LLM-id) tegutseksid väsimatu praktikandina, kes võtab sekunditega kokku mahukaid andmekogumeid ja koostab keerulisi artikleid, et aidata inimestel seljatada vähktõbe või lahendada tuumasünteesi küsimusi. Kuid maailma kõige kriitilisemate teadusvaramute saalides on see praktikant hakanud oma CV-s valetama — ja juhid näitavad neile lõpuks ust.

ArXiv, auväärne avatud juurdepääsuga hoidla, mis on aastakümneid võõrustanud murrangulisi uuringuid füüsikas, matemaatikas ja arvutiteaduses, teatas hiljuti rangest uuest poliitikast. Kui autor esitab artikli, mis sisaldab "ümberlükkamatuid tõendeid" selle kohta, et nad lasksid tehisintellektil töö ära teha ilma tulemusi kontrollimata, ootab neid kohustuslik üheaastane keeld. Tavakasutaja jaoks võib see tunduda akadeemilise sisevaidlusena. Tegelikkuses on see aga aluspanev lahing teabe terviklikkuse eest, mis toidab lõpuks kõike alates teie nutitelefoni aku kestvusest kuni meditsiiniliste nõuanneteni, mida leiate Google'ist.

Müüt automatiseeritud geeniusest

Mõistmaks, miks see samm on nii murranguline, peame esmalt vaatama, mis ArXiv tegelikult on. See ei ole traditsiooniline ajakiri koos aeglase ja vaevalise eelretsenseerimisprotsessiga. Selle asemel on see eeltrükiserver — koht, kuhu teadlased postitavad oma tööd kohe, et globaalne kogukond saaks neid näha. See on teadusmaailma digitaalne toornafta; see on koht, kus ideid viimistletakse enne, kui neist saavad tooted, mida me ostame. Kui ArXivi lähtematerjal saastub "AI-saastaga" (AI slop), hakkab kogu teadmiste järgnev tarneahel üles ütlema.

Aastaid on tehnoloogiamaailm ülistanud LLM-e kui ülimat produktiivsusnippi. Suurt pilti vaadates näeme aga süsteemset nihet, kus genereerimise lihtsus ületab meie kontrollimisvõimekust. Teadlased, kes on tohutu surve all avaldada või hääbuda ("publish or perish"), on hakanud kasutama tehisintellekti mitte ainult korrektorina, vaid varikirjutajana. Probleem? Need tehisintellekti mudelid on sisuliselt keerukad mustrite sobitajad. Nad ei "tea" fakte; nad ennustavad lauses järgmist tõenäolist sõna. Kui neil fakti pole, mõtlevad nad sageli välja sellise, mis kõlab usutavalt — nähtus, mida tuntakse hallutsinatsioonina.

Kui praktikant hakkab asju välja mõtlema

ArXivi arvutiteaduse osakonna juhataja Thomas Dietterich selgitas hiljuti, et hoidla ei keela tehisintellekti kasutamist täielikult. Selle asemel keelavad nad selle hooletu kasutamise. Žargooni taga on Dietterichi viidatud "ümberlükkamatud tõendid" sageli piinlikult ilmsed.

Igapäevaelus oleme kõik näinud tehisintellekti kirjutatud e-kirja märke: ülevoolavalt viisakas toon, geneeriline struktuur või aeg-ajalt sisse jäänud lause "Tehisintellekti keelemudelina ei saa ma...", mille laisk saatja on märkamata jätnud. Kõrgete panustega teadustöö maailmas võtavad need ohumärgid ohtlikumaid vorme:

Hallutsineeritud viited: Tehisintellekt viitab artiklile, mis kõlab ehtsana ja on justkui kirjutatud päris professori poolt, kuid seda artiklit pole lihtsalt olemas.
Sisesed viiped (prompts): Autorid jätavad kogemata oma juhised tehisintellektile (nt "Kirjuta sellele andmestikule kokkuvõte") lõplikku PDF-faili alles.
Kallutatud andmete süntees: Tehisintellekti mudelid kordavad vananenud või ebaõigeid teaduslikke dogmasid, sest neid on treenitud vanematel internetiandmetel.

Ajalooliselt nõudis teaduslik pettus pingutust. Pidi võltsima andmeid või manipuleerima pilte Photoshopis. Nüüd võtab usutava välimusega (kuid täielikult võltsitud) teadusartikli koostamine vähem aega kui pitsa tellimine. Seetõttu liigub ArXiv "ühe eksimuse" reegli poole. Kui moderaatorid leiavad selgeid tõendeid selle kohta, et te ei vaevunud isegi omaenda tehisintellekti loodud tööd läbi lugema, olete mängust väljas.

Üheaastane karistuspink

Uute reeglite kohaselt on tagajärjed karmid. Üheaastane keeld ArXivis on märkimisväärne löök teadlase karjäärile, eriti kiiresti arenevates valdkondades nagu tehisintellekti uuringud, kus esimesena postitamine on kõik. Kuid karistus ei lõpe kaheteistkümne kuu pärast. Kui keeld on tühistatud, peavad kõik nende autorite järgnevad tööd enne ArXivis ilmumist olema heaks kiidetud maineka, eelretsenseeritud väljaande poolt.

Sisuliselt ütleb ArXiv: Kui me ei saa usaldada teid olema iseenda toimetaja, siis me delegeerime selle usalduse kellelegi teisele.

Funktsioon	Inimese juhitud uurimistöö	Kontrollimatu AI-genereerimine
Täpsus	Kõrge (võimalikud inimlikud vead)	Muutlik (aldis hallutsinatsioonidele)
Viited	Tõelised ja kontrollitavad	Sageli välja mõeldud või valesti omistatud
Toon	Spetsiifiline ja tehniline	Geneeriline ja korduv
Vastutus	Autor võtab täieliku vastutuse	Vastutus on sageli läbipaistmatu
Läbivaatamise kiirus	Aeglane ja metoodiline	Kiire

Eemaldumine elevandiluutornist

Huvitaval kombel langeb see karmistamine kokku hoidla suure struktuurilise muudatusega. Pärast üle 20 aasta Cornelli ülikooli hallata olemist on ArXiv muutumas iseseisvaks mittetulundusühinguks. Turu poolelt on see strateegiline käik vastupidavuse saavutamiseks. Iseseisva üksusena saab ArXiv kaasata mitmekesisemat rahastust, et luua automatiseeritud tööriistu ja palgata inimmoderaatoreid, keda on vaja võitlemaks tehisintellekti loodud väärinfo tõusulainega.

Tarbija seisukohast peaksime seda vaatama kui vajalikku infrastruktuuri uuendust. Kui ArXiv täituks ebakvaliteetse sisuga, muutuks see ebastabiilseks keskkonnaks investoritele ja tehnoloogiaettevõtetele, kes toetuvad selle andmetele järgmise põlvkonna seadmete ehitamisel. Oma ridade puhastamisega kaitseb ArXiv tehnoloogiatööstuse alustalasid.

Miks teie uudisvoog sõltub matemaatikasaidist

Teisisõnu, miks peaks tavaline inimene — keegi, kes ei kirjuta artikleid kvanttopoloogiast — sellest hoolima? Sest teadus ei jää laborisse.

Kui ArXivisse postitatakse "murranguline" artikkel, päästab see sageli valla uudiste laine. Kui selle artikli hallutsineeris tehisintellekt ja inimautor seda kunagi ei kontrollinud, liigub see väärinfo läbi uudistetsükli ja maandub lõpuks teie sotsiaalmeedia voos. Oleme juba näinud juhtumeid biomeditsiinilistes uuringutes, kus võltsitud viidete arv on tõusuteel. Kui arst või poliitikakujundaja toetub uuringu kokkuvõttele, mida tegelikult kunagi läbi ei viidud, on reaalmaailma tagajärjed käegakatsutavad ja ohtlikud.

Lõppkokkuvõttes on ArXivi samm meeldetuletus, et detsentraliseeritud teabe maailmas jääb inimfaktor kõige olulisemaks filtriks. Tehisintellekt on võimas tööriist väljundi suurendamiseks, kuid see ei suuda skaleerida tõde. Tõde nõuab inimese aeglast ja metoodilist kontrollitööd.

Signaali eristamine mürast

Vaadates digitaalse teabe muutuvat maastikku, pakub ArXivi uus poliitika mitmeid õppetunde meie endi digiharjumuste jaoks. Me liigume ajastusse, kus sisu loomise kulu on null, mis tähendab, et ka selle sisu väärtus kaldub nulli poole — välja arvatud juhul, kui selle taga on usaldusväärne inimene või institutsioon.

Praktikas peaksime me kõik hakkama rakendama "ArXivi filtrit" tarbitavale teabele. Kui mõni uudis tundub liiga täiuslikult struktureeritud, kasutab liiga üldist keelt või viitab "uuringutele", mida te kiire otsinguga ei leia, suhtuge sellesse sama skeptiliselt kui ArXivi moderaatorid kahtlasesse eeltrükki.

Suurt pilti vaadates ei ole "ühe eksimuse" reegel suunatud ainult laisate teadlaste karistamisele. See on ruumi säilitamine, kus ideid saab vahetada ilma hirmuta mattuda digitaalse müra alla. Kuna tehisintellekt ujutab interneti jätkuvalt sisuga üle, ei ole maailma kõige väärtuslikum ressurss andmed ega töötlemisvõimsus — selleks on usaldus.

Allikad:

ArXiv official governance and policy updates (2024-2026)
404 Media interview with Thomas Dietterich
Cornell University Library administrative reports
Peer-reviewed studies on LLM-generated citation hallucinations

#ArXiv #SuuredKeelemudelid #Teadusuuringud #Tehisintellekt #TehnoloogiaEetika

Kohtumiseni teisel poolel.

Meie läbivalt krüpteeritud e-posti ja pilvesalvestuse lahendus pakub kõige võimsamaid vahendeid turvaliseks andmevahetuseks, tagades teie andmete turvalisuse ja privaatsuse.

/ Tasuta konto loomin

Kohandatud domeenid

Kuni 1TB salvestusruumi

Täiustatud jagamine

End-To-End krüpteerimine

Enesehävituslikud e-kirjad

Kohandatud domeenid

Kuni 1TB salvestusruumi

Täiustatud jagamine

End-To-End krüpteerimine

Enesehävituslikud e-kirjad

Beeble Mail

Beeble Drive

Beeble'i kohta

Missioon

Lugu

Premium

Üldised küsimused

Anneta

Kontaktid