Las inundaciones repentinas se encuentran entre los fenómenos meteorológicos más volátiles y letales del planeta. Cada año, estas súbitas crecidas de agua se cobran más de 5,000 vidas, golpeando a menudo con poco o ningún aviso. Aunque los meteorólogos se han vuelto notablemente expertos en predecir eventos a gran escala como huracanes o inundaciones fluviales estacionales, las inundaciones repentinas siguen siendo un "punto ciego" persistente en el pronóstico meteorológico global.
La razón de esto no es la falta de potencia de cálculo, sino la falta de datos. Para entrenar los modelos de aprendizaje profundo que impulsan las aplicaciones meteorológicas modernas, los científicos necesitan registros históricos. Sin embargo, las inundaciones repentinas suelen ser demasiado localizadas y efímeras para ser capturadas por sensores tradicionales como los medidores de nivel de los ríos. Para cerrar esta brecha, Google Research ha recurrido a una fuente de información poco convencional: los archivos de noticias locales.
En el mundo del pronóstico meteorológico, los datos son el alma de la precisión. Para los ríos principales, disponemos de décadas de datos de caudal registrados por sensores físicos. Pero las inundaciones repentinas suelen ocurrir en pequeños arroyos, calles urbanas o barrancos remotos donde no existen sensores. Sin un registro de dónde y cuándo ocurrieron estas inundaciones en el pasado, los modelos de IA no pueden aprender los patrones necesarios para predecirlas en el futuro.
Esto es lo que los investigadores llaman el problema de la "verdad sobre el terreno" (ground truth). Si un árbol cae en un bosque y ningún sensor registra la vibración, ¿sucedió realmente? En términos hidrológicos, si una inundación repentina destruye un puente en una aldea rural pero no hay un medidor de río cerca, ese evento efectivamente nunca ocurrió en lo que respecta a un modelo informático. Esta falta de información hace que sea casi imposible entrenar modelos globales de IA para reconocer los precursores de una inundación repentina.
Para resolver esto, los investigadores de Google aprovecharon Gemini —el modelo de lenguaje extenso más avanzado de la compañía— para realizar una excavación arqueológica digital masiva. El equipo encargó a la IA la lectura de 5 millones de artículos de noticias que abarcan varias décadas y docenas de idiomas.
El objetivo era encontrar reportes "no estructurados" de inundaciones —fragmentos de noticias locales, despachos de emergencia y archivos comunitarios— y transformarlos en datos "estructurados". Gemini no se limitó a buscar la palabra "inundación"; analizó el contexto para determinar la ubicación exacta, el momento y la gravedad del evento.
El resultado es un conjunto de datos llamado "Groundsource". Contiene 2.6 millones de eventos de inundación distintos, cada uno con geoetiquetado y marca de tiempo. Esto representa un salto masivo en nuestro registro histórico, proporcionando un mapa de alta resolución de dónde ha golpeado el agua en el pasado, incluso en áreas donde la infraestructura física es inexistente.
El uso de un modelo de lenguaje para la investigación hidrológica es un enfoque novedoso. Gila Loike, gerente de producto de Google Research, señaló que esta es la primera vez que la empresa utiliza LLM para construir este tipo específico de datos de series temporales ambientales.
Piénselo como una capa de traducción. Un reporte de noticias podría decir: "Las fuertes lluvias causaron que el cruce de la 5ª con Main se sumergiera bajo tres pies de agua el pasado martes". Gemini traduce esa frase en un conjunto de coordenadas, una fecha y una magnitud. Al multiplicar esto por millones de artículos, de repente se tiene una densa red de puntos de datos que pueden superponerse con imágenes satelitales históricas y registros de precipitaciones.
Al comparar estos reportes derivados de noticias con datos atmosféricos, los modelos de aprendizaje profundo de Google finalmente pueden ver el "porqué" detrás del "dónde". Pueden identificar que una cantidad específica de lluvia en una topografía específica conduce a una inundación, incluso si no hay un solo sensor físico en las cercanías.
Uno de los aspectos más significativos del proyecto Groundsource es su potencial para ayudar al Sur Global. Las naciones en desarrollo a menudo carecen de presupuesto para instalar y mantener costosas estaciones de medición de ríos. En consecuencia, estas regiones suelen ser las más vulnerables a los desastres relacionados con el clima y las menos equipadas con sistemas de alerta temprana.
Debido a que Groundsource se basa en reportes de noticias y archivos digitales en lugar de hardware físico, puede proporcionar un contexto histórico para regiones que anteriormente eran desiertos de datos. Al hacer público este conjunto de datos, Google está proporcionando a los gobiernos locales y a las ONG una base para construir sus propios sistemas de alerta temprana localizados.
Si bien el conjunto de datos Groundsource es principalmente una herramienta para investigadores y meteorólogos, sus implicaciones eventualmente llegarán al usuario promedio de teléfonos inteligentes. Esto es lo que significa este cambio en el pronóstico para el futuro cercano:
La decisión de Google de compartir la investigación y el conjunto de datos Groundsource de forma pública marca un cambio hacia una IA climática colaborativa. Al proporcionar la "verdad sobre el terreno" que antes faltaba, están invitando a la comunidad científica global a perfeccionar estos modelos.
A medida que el cambio climático aumenta la frecuencia e intensidad de los fenómenos meteorológicos extremos, la capacidad de predecir lo impredecible se convierte en una cuestión de supervivencia. Al enseñar a la IA a leer las noticias, finalmente le estamos dando el contexto que necesita para ver venir las inundaciones antes de que el agua comience a subir.



Nuestra solución de correo electrónico cifrado y almacenamiento en la nube de extremo a extremo proporciona los medios más potentes para el intercambio seguro de datos, lo que garantiza la seguridad y la privacidad de sus datos.
/ Crear una cuenta gratuita