Staigūs potvyniai yra vieni nepastoviausių ir mirtingiausių oro reiškinių planetoje. Kasmet šios staigios vandens bangos nusineša daugiau nei 5 000 gyvybių, dažnai smogdamos beveik be jokio įspėjimo. Nors meteorologai tapo nepaprastai įgudę prognozuoti didelio masto reiškinius, tokius kaip uraganai ar sezoniniai upių potvyniai, staigūs potvyniai išlieka sunkiai įveikiama „akloji zona“ pasaulinėse orų prognozėse.
Priežastis yra ne skaičiavimo galios trūkumas, o duomenų stoka. Norėdami apmokyti giliojo mokymosi modelius, kuriais grindžiamos šiuolaikinės orų programėlės, mokslininkams reikia istoriškai užfiksuotų duomenų. Tačiau staigūs potvyniai dažnai būna per daug lokalizuoti ir trumpalaikiai, kad juos užfiksuotų tradiciniai jutikliai, pavyzdžiui, upių matuokliai. Siekdama užpildyti šią spragą, „Google Research“ kreipėsi į netradicinį informacijos šaltinį: vietinių naujienų archyvus.
Orų prognozavimo pasaulyje duomenys yra tikslumo pagrindas. Didžiųjų upių atveju turime dešimtmečius kauptus tėkmės duomenis, užfiksuotus fizinių jutiklių. Tačiau staigūs potvyniai dažnai kyla mažuose upeliuose, miestų gatvėse ar atokiose griovose, kur jutiklių nėra. Be įrašų apie tai, kur ir kada šie potvyniai vyko praeityje, DI modeliai negali išmokti dėsningumų, būtinų jiems prognozuoti ateityje.
Tai tyrėjai vadina „tikrosios padėties“ (angl. ground truth) problema. Jei miške nukrenta medis ir joks jutiklis neužfiksuoja vibracijos, ar tai įvyko? Hidrologiniu požiūriu, jei staigus potvynis sugriauna tiltą kaimo vietovėje, bet šalia nėra upės matuoklio, kompiuterinio modelio požiūriu tas įvykis faktiškai niekada neįvyko. Dėl šios trūkstamos informacijos beveik neįmanoma apmokyti pasaulinių DI modelių atpažinti staigaus potvynio pranašus.
Siekdami tai išspręsti, „Google“ tyrėjai pasitelkė „Gemini“ – pažangiausią bendrovės didįjį kalbos modelį – masiniams skaitmeniniams archeologiniams kasinėjimams atlikti. Komanda pavedė DI perskaityti 5 milijonus naujienų straipsnių, apimančių kelis dešimtmečius ir dešimtis kalbų.
Tikslas buvo rasti „nestruktūrizuotus“ pranešimus apie potvynius – vietinių naujienų fragmentus, skubios pagalbos pranešimus ir bendruomenių archyvus – ir paversti juos „struktūrizuotais“ duomenimis. „Gemini“ ne tik ieškojo žodžio „potvynis“; jis analizavo kontekstą, kad nustatytų tikslią vietą, laiką ir įvykio mastą.
Rezultatas – duomenų rinkinys, pavadintas „Groundsource“. Jame yra 2,6 milijono skirtingų potvynių įvykių, kurių kiekvienas pažymėtas geografine nuoroda ir laiko žyma. Tai didžiulis šuolis mūsų istoriniuose metraščiuose, suteikiantis didelės raiškos žemėlapį, rodantį, kur vanduo kilo praeityje, net ir tose vietose, kur nėra fizinės infrastruktūros.
Kalbos modelio naudojimas hidrologiniams tyrimams yra naujas požiūris. Gila Loike, „Google Research“ produktų vadovė, pažymėjo, kad tai pirmas kartas, kai bendrovė panaudojo LLM tokio specifinio tipo aplinkos laiko eilučių duomenims kurti.
Įsivaizduokite tai kaip vertimo sluoksnį. Naujienų pranešime gali būti rašoma: „Dėl smarkių liūčių praėjusį antradienį 5-osios ir Pagrindinės gatvių sankryža buvo apsemta trijų pėdų vandens sluoksniu“. „Gemini“ išverčia šį sakinį į koordinačių rinkinį, datą ir mastą. Kai tai padauginate iš milijonų straipsnių, staiga gaunate tankų duomenų taškų tinklą, kurį galima susieti su istoriniais palydoviniais vaizdais ir kritulių kiekio įrašais.
Lygindami šiuos iš naujienų gautus pranešimus su atmosferos duomenimis, „Google“ giliojo mokymosi modeliai pagaliau gali pamatyti priežastį, slypinčią už vietos. Jie gali nustatyti, kad konkretus kritulių kiekis konkrečioje topografijoje sukelia potvynį, net jei apylinkėse nėra nė vieno fizinio jutiklio.
Vienas svarbiausių „Groundsource“ projekto aspektų yra jo potencialas padėti Globaliesiems Pietums. Besivystančioms šalims dažnai trūksta biudžeto brangioms upių matavimo stotims įrengti ir prižiūrėti. Todėl šie regionai dažnai yra labiausiai pažeidžiami su klimatu susijusių nelaimių ir mažiausiai aprūpinti ankstyvojo įspėjimo sistemomis.
Kadangi „Groundsource“ remiasi naujienų pranešimais ir skaitmeniniais archyvais, o ne fizine įranga, jis gali suteikti istorinį kontekstą regionams, kurie anksčiau buvo „duomenų dykumos“. Viešindama šį duomenų rinkinį, „Google“ suteikia vietos valdžios institucijoms ir nevyriausybinėms organizacijoms pagrindą kurti savo lokalizuotas ankstyvojo įspėjimo sistemas.
Nors „Groundsource“ duomenų rinkinis pirmiausia yra įrankis tyrėjams ir meteorologams, jo poveikis ilgainiui pasieks ir paprastą išmaniojo telefono naudotoją. Štai ką šis pokytis prognozavimo srityje reiškia artimiausiai ateičiai:
„Google“ sprendimas viešai dalytis „Groundsource“ tyrimais ir duomenų rinkiniu žymi posūkį link bendradarbiavimu grįsto klimato DI. Pateikdami „tikrąją padėtį“, kurios anksčiau trūko, jie kviečia pasaulinę mokslo bendruomenę tobulinti šiuos modelius.
Kadangi klimato kaita didina ekstremalių orų dažnumą ir intensyvumą, gebėjimas numatyti tai, kas nenuspėjama, tampa išlikimo klausimu. Mokydami DI skaityti naujienas, mes pagaliau suteikiame jam kontekstą, kurio reikia, kad jis pamatytų artėjančius potvynius dar prieš pradedant kilti vandeniui.



Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.
/ Sukurti nemokamą paskyrą