Pramonės naujienos

Kaip „Google“ paverčia 5 milijonus naujienų pranešimų gyvybes gelbstinčia staigių potvynių prognozavimo priemone

„Google“ naudoja „Gemini“ DI 5 milijonams naujienų pranešimų analizuoti, sukurdama „Groundsource“ duomenų rinkinį, skirtą prognozuoti mirtinus staigius potvynius vietovėse be jutiklių.
Rahul Mehta
Rahul Mehta
2026 m. kovo 12 d.
Kaip „Google“ paverčia 5 milijonus naujienų pranešimų gyvybes gelbstinčia staigių potvynių prognozavimo priemone

Staigūs potvyniai yra vieni nepastoviausių ir mirtingiausių oro reiškinių planetoje. Kasmet šios staigios vandens bangos nusineša daugiau nei 5 000 gyvybių, dažnai smogdamos beveik be jokio įspėjimo. Nors meteorologai tapo nepaprastai įgudę prognozuoti didelio masto reiškinius, tokius kaip uraganai ar sezoniniai upių potvyniai, staigūs potvyniai išlieka sunkiai įveikiama „akloji zona“ pasaulinėse orų prognozėse.

Priežastis yra ne skaičiavimo galios trūkumas, o duomenų stoka. Norėdami apmokyti giliojo mokymosi modelius, kuriais grindžiamos šiuolaikinės orų programėlės, mokslininkams reikia istoriškai užfiksuotų duomenų. Tačiau staigūs potvyniai dažnai būna per daug lokalizuoti ir trumpalaikiai, kad juos užfiksuotų tradiciniai jutikliai, pavyzdžiui, upių matuokliai. Siekdama užpildyti šią spragą, „Google Research“ kreipėsi į netradicinį informacijos šaltinį: vietinių naujienų archyvus.

Duomenų trūkumas hidrologijoje

Orų prognozavimo pasaulyje duomenys yra tikslumo pagrindas. Didžiųjų upių atveju turime dešimtmečius kauptus tėkmės duomenis, užfiksuotus fizinių jutiklių. Tačiau staigūs potvyniai dažnai kyla mažuose upeliuose, miestų gatvėse ar atokiose griovose, kur jutiklių nėra. Be įrašų apie tai, kur ir kada šie potvyniai vyko praeityje, DI modeliai negali išmokti dėsningumų, būtinų jiems prognozuoti ateityje.

Tai tyrėjai vadina „tikrosios padėties“ (angl. ground truth) problema. Jei miške nukrenta medis ir joks jutiklis neužfiksuoja vibracijos, ar tai įvyko? Hidrologiniu požiūriu, jei staigus potvynis sugriauna tiltą kaimo vietovėje, bet šalia nėra upės matuoklio, kompiuterinio modelio požiūriu tas įvykis faktiškai niekada neįvyko. Dėl šios trūkstamos informacijos beveik neįmanoma apmokyti pasaulinių DI modelių atpažinti staigaus potvynio pranašus.

„Gemini“ ir „Groundsource“ projektas

Siekdami tai išspręsti, „Google“ tyrėjai pasitelkė „Gemini“ – pažangiausią bendrovės didįjį kalbos modelį – masiniams skaitmeniniams archeologiniams kasinėjimams atlikti. Komanda pavedė DI perskaityti 5 milijonus naujienų straipsnių, apimančių kelis dešimtmečius ir dešimtis kalbų.

Tikslas buvo rasti „nestruktūrizuotus“ pranešimus apie potvynius – vietinių naujienų fragmentus, skubios pagalbos pranešimus ir bendruomenių archyvus – ir paversti juos „struktūrizuotais“ duomenimis. „Gemini“ ne tik ieškojo žodžio „potvynis“; jis analizavo kontekstą, kad nustatytų tikslią vietą, laiką ir įvykio mastą.

Rezultatas – duomenų rinkinys, pavadintas „Groundsource“. Jame yra 2,6 milijono skirtingų potvynių įvykių, kurių kiekvienas pažymėtas geografine nuoroda ir laiko žyma. Tai didžiulis šuolis mūsų istoriniuose metraščiuose, suteikiantis didelės raiškos žemėlapį, rodantį, kur vanduo kilo praeityje, net ir tose vietose, kur nėra fizinės infrastruktūros.

Kalbos pavertimas logika

Kalbos modelio naudojimas hidrologiniams tyrimams yra naujas požiūris. Gila Loike, „Google Research“ produktų vadovė, pažymėjo, kad tai pirmas kartas, kai bendrovė panaudojo LLM tokio specifinio tipo aplinkos laiko eilučių duomenims kurti.

Įsivaizduokite tai kaip vertimo sluoksnį. Naujienų pranešime gali būti rašoma: „Dėl smarkių liūčių praėjusį antradienį 5-osios ir Pagrindinės gatvių sankryža buvo apsemta trijų pėdų vandens sluoksniu“. „Gemini“ išverčia šį sakinį į koordinačių rinkinį, datą ir mastą. Kai tai padauginate iš milijonų straipsnių, staiga gaunate tankų duomenų taškų tinklą, kurį galima susieti su istoriniais palydoviniais vaizdais ir kritulių kiekio įrašais.

Lygindami šiuos iš naujienų gautus pranešimus su atmosferos duomenimis, „Google“ giliojo mokymosi modeliai pagaliau gali pamatyti priežastį, slypinčią už vietos. Jie gali nustatyti, kad konkretus kritulių kiekis konkrečioje topografijoje sukelia potvynį, net jei apylinkėse nėra nė vieno fizinio jutiklio.

Pasaulinė lygybė įspėjant apie nelaimes

Vienas svarbiausių „Groundsource“ projekto aspektų yra jo potencialas padėti Globaliesiems Pietums. Besivystančioms šalims dažnai trūksta biudžeto brangioms upių matavimo stotims įrengti ir prižiūrėti. Todėl šie regionai dažnai yra labiausiai pažeidžiami su klimatu susijusių nelaimių ir mažiausiai aprūpinti ankstyvojo įspėjimo sistemomis.

Kadangi „Groundsource“ remiasi naujienų pranešimais ir skaitmeniniais archyvais, o ne fizine įranga, jis gali suteikti istorinį kontekstą regionams, kurie anksčiau buvo „duomenų dykumos“. Viešindama šį duomenų rinkinį, „Google“ suteikia vietos valdžios institucijoms ir nevyriausybinėms organizacijoms pagrindą kurti savo lokalizuotas ankstyvojo įspėjimo sistemas.

Praktinės įžvalgos ateičiai

Nors „Groundsource“ duomenų rinkinis pirmiausia yra įrankis tyrėjams ir meteorologams, jo poveikis ilgainiui pasieks ir paprastą išmaniojo telefono naudotoją. Štai ką šis pokytis prognozavimo srityje reiškia artimiausiai ateičiai:

  • Itin lokalūs įspėjimai: Tikimasi, kad įspėjimai apie potvynius taps konkretesni. Vietoj viso rajono stebėjimo galite gauti pranešimą apie konkretų kvartalą ar kelio ruožą.
  • Geresnis miestų planavimas: Miestų planuotojai gali naudoti šiuos istorinius duomenis, kad nustatytų „karštuosius taškus“, kurie naujienų pranešimuose buvo minimi ne vienerius metus, tačiau nebuvo oficialiai užfiksuoti hidrologinėse duomenų bazėse.
  • Draudimas ir rizikos vertinimas: Tikslesni istoriniai duomenys tikriausiai pakeis potvynių draudimo kainodarą ir rizikos vertinimą anksčiau nestebėtose vietovėse.
  • DI kaip daugiafunkcis įrankis: Šis projektas įrodo, kad LLM skirti ne tik el. laiškams rašyti ar kodui generuoti; tai galingi įrankiai, padedantys sutvarkyti „netvarkingą“ pasaulio informaciją į mokslinius duomenų rinkinius.

Kelias į priekį

„Google“ sprendimas viešai dalytis „Groundsource“ tyrimais ir duomenų rinkiniu žymi posūkį link bendradarbiavimu grįsto klimato DI. Pateikdami „tikrąją padėtį“, kurios anksčiau trūko, jie kviečia pasaulinę mokslo bendruomenę tobulinti šiuos modelius.

Kadangi klimato kaita didina ekstremalių orų dažnumą ir intensyvumą, gebėjimas numatyti tai, kas nenuspėjama, tampa išlikimo klausimu. Mokydami DI skaityti naujienas, mes pagaliau suteikiame jam kontekstą, kurio reikia, kad jis pamatytų artėjančius potvynius dar prieš pradedant kilti vandeniui.

Šaltiniai

  • Google Research: Official Blog and Publications
  • World Meteorological Organization: Flash Flood Statistics and Impact
  • Nature: Advancements in AI for Hydrological Modeling
bg
bg
bg

Iki pasimatymo kitoje pusėje.

Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.

/ Sukurti nemokamą paskyrą