Pēkšņi plūdi ir viena no nepastāvīgākajām un nāvējošākajām laikapstākļu parādībām uz planētas. Katru gadu šie pēkšņie ūdens uzplūdi prasa vairāk nekā 5000 dzīvību, bieži vien piemeklējot ar mazu brīdinājumu vai bez tā. Lai gan meteorologi ir kļuvuši ievērojami prasmīgi liela mēroga notikumu, piemēram, viesuļvētru vai sezonālu upju plūdu, prognozēšanā, pēkšņi plūdi joprojām ir spītīgs "pamanāmības tukšums" globālajā laikapstākļu prognozēšanā.
Iemesls tam nav skaitļošanas jaudas trūkums, bet gan datu trūkums. Lai apmācītu dziļās mācīšanās modeļus, kas nodrošina mūsdienu laikapstākļu lietotņu darbību, zinātniekiem ir nepieciešami vēsturiskie dati. Tomēr pēkšņi plūdi bieži vien ir pārāk lokalizēti un īslaicīgi, lai tos fiksētu tradicionālie sensori, piemēram, upju līmeņa mērītāji. Lai pārvarētu šo plaisu, Google Research ir pievērsies netradicionālam informācijas avotam: vietējo ziņu arhīviem.
Laikapstākļu prognozēšanas pasaulē dati ir precizitātes pamats. Lielajām upēm mums ir gadu desmitiem ilgi plūsmas dati, ko reģistrējuši fiziski sensori. Taču pēkšņi plūdi bieži notiek mazos strautos, pilsētu ielās vai attālās aizās, kur sensoru nav. Bez reģistrētiem datiem par to, kur un kad šie plūdi notikuši pagātnē, AI modeļi nevar apgūt modeļus, kas nepieciešami to prognozēšanai nākotnē.
To pētnieki sauc par "patiesā pamata" (ground truth) problēmu. Ja mežā nokrīt koks un neviens sensors nereģistrē vibrāciju, vai tas vispār notika? Hidroloģiskā izteiksmē — ja pēkšņi plūdi iznīcina tiltu lauku ciemā, bet tuvumā nav upes līmeņa mērītāja, šis notikums datora modeļa skatījumā faktiski nekad nav noticis. Šī trūkstošā informācija padara gandrīz neiespējamu globālo AI modeļu apmācību, lai tie atpazītu pēkšņu plūdu priekšvēstnešus.
Lai to atrisinātu, Google pētnieki izmantoja Gemini — uzņēmuma vismodernāko lielo valodas modeli —, lai veiktu vērienīgus digitālos arheoloģiskos izrakumus. Komanda uzdeva mākslīgajam intelektam izlasīt 5 miljonus ziņu rakstu, kas aptver vairākas desmitgades un desmitiem valodu.
Mērķis bija atrast "nestrukturētus" ziņojumus par plūdiem — vietējo ziņu fragmentus, ārkārtas dienestu ziņojumus un kopienu arhīvus — un pārvērst tos "strukturētos" datos. Gemini ne tikai meklēja vārdu "plūdi"; tas analizēja kontekstu, lai noteiktu precīzu notikuma vietu, laiku un smaguma pakāpi.
Rezultāts ir datu kopa ar nosaukumu "Groundsource". Tā satur 2,6 miljonus atsevišķu plūdu notikumu, katrs no tiem ir papildināts ar ģeogrāfisko atzīmi un laika zīmogu. Tas ir milzīgs lēciens mūsu vēsturiskajos ierakstos, nodrošinot augstas izšķirtspējas karti par to, kur ūdens ir skāris pagātnē, pat vietās, kur fiziskā infrastruktūra neeksistē.
Valodas modeļa izmantošana hidroloģiskajiem pētījumiem ir jauna pieeja. Gila Loike, Google Research produktu vadītāja, atzīmēja, ka šī ir pirmā reize, kad uzņēmums ir izmantojis LLM, lai izveidotu šāda veida specifiskus vides laika rindu datus.
Domājiet par to kā par tulkošanas slāni. Ziņu ziņojumā varētu būt teikts: "Spēcīgas lietusgāzes pagājušajā otrdienā izraisīja 5. un Galvenās ielas krustojuma applūšanu trīs pēdu dziļumā." Gemini pārtulko šo teikumu koordinātu kopā, datumā un magnitūdā. Reizinot to ar miljoniem rakstu, pēkšņi rodas blīvs datu punktu tīkls, ko var pārklāt ar vēsturiskiem satelītattēliem un nokrišņu datiem.
Salīdzinot šos no ziņām atvasinātos ziņojumus ar atmosfēras datiem, Google dziļās mācīšanās modeļi beidzot var saskatīt cēloņsakarību aiz atrašanās vietas. Tie var identificēt, ka konkrēts nokrišņu daudzums konkrētā topogrāfijā izraisa plūdus, pat ja tuvumā nav neviena fiziska sensora.
Viens no nozīmīgākajiem Groundsource projekta aspektiem ir tā potenciāls palīdzēt globālajiem dienvidiem. Jaunattīstības valstīm bieži trūkst budžeta, lai uzstādītu un uzturētu dārgas upju mērīšanas stacijas. Līdz ar to šie reģioni bieži ir visneaizsargātākie pret ar klimatu saistītām katastrofām un vismazāk aprīkoti ar agrīnās brīdināšanas sistēmām.
Tā kā Groundsource paļaujas uz ziņu ziņojumiem un digitālajiem arhīviem, nevis fizisku aparatūru, tas var sniegt vēsturisko kontekstu reģioniem, kas iepriekš bija "datu tuksneši". Padarot šo datu kopu publisku, Google sniedz vietējām valdībām un NVO pamatu savu lokalizētu agrīnās brīdināšanas sistēmu izveidei.
Lai gan Groundsource datu kopa galvenokārt ir rīks pētniekiem un meteorologiem, tās ietekme galu galā sasniegs vidējo viedtālruņa lietotāju. Lūk, ko šīs pārmaiņas prognozēšanā nozīmē tuvākajā nākotnē:
Google lēmums publiski dalīties ar Groundsource pētījumu un datu kopu iezīmē pāreju uz sadarbībā balstītu klimata AI. Nodrošinot "patieso pamatu", kura iepriekš trūka, viņi aicina globālo zinātnieku kopienu pilnveidot šos modeļus.
Tā kā klimata pārmaiņas palielina ekstremālu laikapstākļu biežumu un intensitāti, spēja prognozēt neprognozējamo kļūst par izdzīvošanas jautājumu. Mācot AI lasīt ziņas, mēs beidzot sniedzam tam nepieciešamo kontekstu, lai saskatītu plūdu tuvošanos, pirms ūdens sāk celties.



Mūsu end-to-end šifrētais e-pasta un mākoņdatu glabāšanas risinājums nodrošina visefektīvākos līdzekļus drošai datu apmaiņai, garantējot jūsu datu drošību un konfidencialitāti.
/ Izveidot bezmaksas kontu