Artículo Original

http://opn.to/a/DUHPz

Corrección del pronóstico cuantitativo de la precipitación mediante el uso de redes neuronales

Quantitative precipitation forecast correction using neural network


RESUMEN

En el presente trabajo se propone un modelo de redes neuronales como una técnica eficaz para la corrección del pronóstico cuantitativo de precipitación brindado por el modelo WRF. Para ello se emplea un Perceptrón Multi-Capa, con el objetivo de utilizar la salida (observaciones brindadas por las estaciones en superficie) para establecer una relación con los elementos de entrada (salidas del WRF). Se realiza el entrenamiento del modelo con datos reales de acumulado de precipitación correspondientes al año 2017; y se realiza la evaluación con el período comprendido entre el 4 de noviembre de 2018 y el 28 de febrero de 2019. Se logró la corrección del pronóstico cuantitativo de la precipitación en las estaciones analizadas, siendo más significativa la mejoría para la estación de Montaña y en los casos en los que el WRF sobreestima el acumulado de precipitación.

Palabras clave: 

redes neuronales artificiales; pronóstico cuantitativo de precipitación; WRF; corrección de sesgos.

ABSTRACT

In this paper, a model of neural networks is proposed as an effective technique for the correction of the quantitative precipitation forecast provided by the WRF model. For this, a Multi-Layer Perceptron is used, with the aim of using the output (observations provided by the surface stations) to establish a relationship with the input elements (WRF outputs). Model training is carried out with real rainfall accumulation data corresponding to 2017; and the evaluation is carried out with the period between November 4, 2018 and February 28, 2019. The correction of the quantitative precipitation forecast in the analyzed stations was achieved, the improvement for the mountain station was more significant and, in cases where the WRF overestimates the accumulated rainfall.

Key words: 

artificial neural networks; quantitative forecast precipitation; WRF; bias correction.


INTRODUCCIÓN

Las Redes Neuronales Artificiales (RNA) son un paradigma que ha despertado un gran interés en los últimos años. Son modelos que se inspiran en la Biología, en contraposición a los sistemas inteligentes tradicionales basados en reglas, probabilidad, etc., por lo que su forma de representar el conocimiento es abstracta (en base a la arquitectura de la red y las conexiones que se establecen entre las neuronas). Se construyen por medio de algoritmos automáticos de aprendizaje, que ajustan las conexiones entre neuronas para modelar un conjunto de datos. Las redes neuronales son métodos de tipo “caja negra”, pues el modelo resultante es difícil de interpretar a partir de los datos. Una descripción detallada de este campo se puede consultar en (Bishop, 1995) y (Haykin, 1998). Las redes neuronales han probado su valía para resolver problemas complejos en diversas áreas, incluyendo la predicción meteorológica (Hsieh, et al., 1998), (Schizas, et al., 1994). En los últimos años se han desarrollado diversas extensiones de estos, especializados en problemas concretos; por ejemplo, las redes funcionales permiten incluir conocimiento cualitativo del problema en la estructura de la red (Castillo, et al., 1999); también se han aplicado técnicas modernas de optimización, como los algoritmos genéticos, para buscar una estructura más conveniente de la red para un problema dado (Cofiño, et al., 2004). Actualmente las redes neuronales son un campo muy consolidado en el que continuamente se desarrollan nuevos métodos y aplicaciones.

Los modelos de pronóstico numérico del tiempo, operativos en el Instituto de Meteorología (INSMET), permiten la obtención del pronóstico cuantitativo de la precipitación. Las evaluaciones realizadas han identificado que los modelos tienen muy buena habilidad para pronosticar las áreas de precipitación, pero un gran error al pronosticar el acumulado. Con el objetivo de ajustar o corregir la predicción obtenida a partir del modelo, se han desarrollado numerosos métodos con un enfoque estadístico como son los Modelos Autorregresivos Integrados de Promedio Móvil (ARIMA), las wavelets y las redes neuronales, mostrando estos últimos muy buenos resultados, en particular para la precipitación.

En la investigación que se presenta se utiliza un modelo de red neuronal artificial, para la corrección del pronóstico cuantitativo de la precipitación obtenido a partir de la configuración del modelo Weather Research & Forecast (WRF), que forma parte del Sistema de Pronóstico Inmediato (SisPI), (Sierra, et al., 2014). En particular se utiliza un Perceptrón Multi-Capa. La configuración del modelo de red, se obtiene a partir del diseño de un grupo de experimentos y configuraciones. En estos se prueban parámetros como la cantidad de neuronas de las capas ocultas, la función de activación a utilizar, entre otros. El documento cuenta además de la Introducción, con una sección en la que se describe la configuración del WRF, la estructura del Perceptrón Multi-Capa y los materiales y métodos utilizados en la evaluación. Seguidamente se presentan el análisis de los resultados, en donde se expone la configuración de red que tuvo la mejor habilidad para corregir la precipitación. Luego se presentan los resultados de la evaluación de la misma. Las conclusiones y recomendaciones, seguidas de la bibliografía consultada, cierran el texto.

MATERIALES Y MÉTODOS

El modelo de pronóstico numérico del tiempo WRF, ha sido desarrollado por la división de Meteorología de Microescala y Mesoescala de la NCAR (National Center for Atmospheric Research). Del WRF, se utilizó el núcleo dinámico ARW (Advanced Research WRF) que actualmente está en su versión 4, y ha sufrido actualizaciones hasta la versión 4.0.1, que es la más reciente. Según sus desarrolladores, es posible su aplicación en un amplio espectro de escalas espaciales que van desde los metros a miles de kilómetros (Manual del WRF, 2004). Este modelo es la base del SisPI y está configurado como sigue:

  • La inicialización se basa en los datos del GFS de 0.5 grados,

  • Tres dominios anidados con resolución 27 km, 9 km y 3 km (ver Figura 1),

  • Proyección Mercator,

  • Centrados en 22.3° N y −79.1° W cerca del centro del país,

  • Parametrización de cúmulos Grell-Freitas (Grell, et al., 2013),

  • Parametrización de Microfísica WSM5 para los dominios de 27 km y 9km de resolución, mientras que para el dominio de más alta resolución se utiliza Morrison de doble momento.

Diseño y arquitectura de la Red Neuronal

Se utilizó el Perceptrón Multi-Capa (MLP por sus siglas en inglés), debido a que este describe una red neuronal artificial que utiliza la salida para establecer una relación con los datos de entrada. Fue conveniente utilizarlo al disponer de grandes cantidades de datos (salidas del modelo WRF) que están relacionados y conocer de antemano la salida (valor real reportado en las estaciones meteorológicas). Esta red establece una relación entre los datos de entrada y los datos de salida a partir de ciertos valores esperados. Está formada por neuronas que calculan el producto punto de los pesos por las entradas, más unos pesos extras llamados umbrales (bias). Con el resultado que se obtuvo del producto punto se evaluó la función de activación. Las redes estaban formadas por varias capas de neuronas, así que la salida de las neuronas en una capa formaba la entrada de la capa siguiente. Durante el aprendizaje, la red calculó los pesos usando el algoritmo de propagación hacia atrás. El objetivo fue usar el error que existió entre la salida de la red y el valor esperado para ajustar la matriz de pesos y minimizar el error.

Tomado de (Sierra, et al., 2014)

Figura 1. 

Dominios del modelo WRF.

En relación a la cantidad de capas, se demostró que un Perceptrón con dos capas (una oculta y la capa de salida) puede aproximar con un grado de exactitud dado, cualquier función continua; además, cuando las funciones no son continuas solo se requiere una capa adicional (Cybenko, 1989). Este resultado resolvió parcialmente el problema de la estructura de red apropiada para el problema en cuestión. Considerando continua la función de precipitación, el problema se redujo a elegir un número apropiado de neuronas en la capa oculta para ajustar el modelo. Este número también debía tener una cota superior para evitar un sobreajuste de la red, es decir, el número total de parámetros ha de ser mucho menor que el número de datos disponible (Cofiño, et al., 2004; Gutierrez, et al., 2004). Sin embargo, aun así, en la práctica fue necesario probar redes con distintas configuraciones para obtener un modelo apropiado. De lo anterior, se utilizó un Perceptrón de dos capas (una oculta y la capa de salida) y se varió la cantidad de neuronas en la capa de entrada en dependencia de los predictores de precipitación usados (cero, uno o dos plazos anteriores). Además, se probaron distintas cantidades de neuronas en la capa oculta, con el fin de obtener el mejor desempeño de la red; mientras que la capa de salida contaba con sólo una neurona (el valor de precipitación obtenido por el modelo de red). Por otra parte, se analizó el efecto de normalizar o no los datos para el entrenamiento y se utilizaron funciones de activación sigmoideas (salidas en el intervalo [0, 1]). Se realizó cada entrenamiento con 1000 iteraciones, con el objetivo de lograr el menor error posible. Como función de costo se empleó el error cuadrático medio, se utilizó el 80% de los datos para el entrenamiento y el resto para la validación.

Datos utilizados y período de estudio

Del SisPI se utilizaron las corridas correspondientes al año 2017 en particular, las salidas para el dominio 3, con inicialización a las 0000 UTC. Para el entrenamiento y la evaluación se utilizaron los datos de la Red de Estaciones Meteorológicas de Cuba.

La evaluación del modelo de red, se realizó con salidas de SisPI, comprendidas entre el 4 de noviembre de 2018 y el 28 de febrero de 2019, y los datos de las estaciones en superficie en el mismo período de tiempo.

Se utilizaron los datos de cuatro estaciones meteorológicas representativas del país, para obtener los valores reales de precipitación, con los cuales, a partir de las salidas del modelo WRF, se entrenó el modelo de red. Se realizó un pre-procesamiento de las salidas del modelo WRF, pues las mediciones en las estaciones eran trihorarias, mientras que las salidas del dominio 3 del modelo WRF eran horarias; además, se tenía para cada estación, todos los días, mientras que en la salida del modelo WRF se tenía para cada día, todas las estaciones. Se obtuvieron los valores puntuales mediante la interpolación utilizando el método del “vecino más cercano”.

Las estaciones seleccionadas, representativas del espacio muestral, son las que siguen:

  • Camagüey (355)

  • Topes de Collantes (342)

  • Casablanca (325)

  • Playa Girón (333)

Procesamiento de los datos de entrada del Modelo de Redes Neuronales Artificiales (MRNA)

Adicionando variables (Temperatura, Presión, Humedad, …) como predictores a los datos de entrada del MRNA (datos de precipitación obtenidos por el modelo WRF), no se logra mejorar la actuación de la red. La mejor representación es obtenida cuando la precipitación es seleccionada como predictor de sí misma (Sanaz, 2015); esto coincide con el resultado obtenido por Hidalgo (Hidalgo, et al., 2008). Desde que descubrieron que el mejor predictor de la precipitación es ella misma, examinaron el efecto de adicionar períodos de tiempo a la entrada. La actuación de la red mejoró cuando cero, uno, dos, y tres períodos de precipitación (P, Pt−1, Pt−2, Pt−3) fueron usados como entrada. La mejora de la red finalizaba después de períodos de tiempo mayores que tres. Teniendo en cuenta este resultado, se utilizó para el entrenamiento el acumulado de precipitación y como predictores dos plazos anteriores.

Diseño de los experimentos

Se realizaron 28 experimentos (ver Tabla 1) donde se analizaron los siguientes aspectos:

Datos

  • con ceros: Se analizó todo el set de datos durante el entrenamiento.

  • sin ceros: Se analizaron los datos distintos de cero tanto en las salidas del modelo WRF como en las estaciones meteorológicas. Estos valores se consideraron aciertos del modelo, por lo que no se utilizaron durante el entrenamiento.

Período

  • 3h: Se realizó el entrenamiento con acumulados trihorarios, y se comparó la salida del MRNA con los correspondientes valores del WRF y de las estaciones.

  • 24h antes: Se realizó el entrenamiento con acumulados en 24h, y se comparó la salida del MRNA con los correspondientes valores del WRF y de las estaciones.

  • 24h después: Se realizó el entrenamiento con acumulados en 3h, posteriormente se obtuvo el acumulado en 24h mediante la suma de los valores de un mismo día, y se comparó la salida del MRNA con los correspondientes valores del WRF y de las estaciones.

Normalizados

  • sí: Se normalizaron los datos antes del entrenamiento.

  • no: No se normalizaron los datos antes del entrenamiento.

Plazos

  • 0: No se utilizaron plazos anteriores como predictores. Se utilizó en la capa de entrada una neurona (valor de precipitación pronosticado por el modelo WRF).

  • 1: Se utilizó un plazo anterior como predictor. La capa de entrada contaba con dos neuronas (valor de precipitación pronosticado por el modelo WRF y un plazo anterior).

  • 2: Se utilizaron dos plazos anteriores como predictores. La capa de entrada contaba con tres neuronas (valor de precipitación pronosticado por el modelo WRF y dos plazos anteriores).

Tabla 1. 

Diseño de los experimentos

ExperimentoDatosPeríodoNormalizadosPlazos
1,2,3con ceros3h0,1,2
4,5,6con ceros3hno0,1,2
7,8,9sin ceros3h0,1,2
10,11,12sin ceros3hno0,1,2
13con ceros24h antes0
14con ceros24h antesno0
15sin ceros24h antes0
16sin ceros24h antesno0
17,18,19con ceros24h después0,1,2
20,21,22con ceros24h despuésno0,1,2
23,24,25sin ceros24h después0,1,2
26,27,28sin ceros24h despuésno0,1,2

Para cada experimento se probaron 18 configuraciones (ver Tabla 2) del MRNA, para encontrar, por cada estación, el mejor par experimento-configuración. Se combinaron dos funciones de activación (sigmoid y softsign), y se tomaron distintas cantidades de neuronas en la capa oculta, de forma tal que el número de parámetros fuese suficientemente menor que el total de datos utilizados para el entrenamiento. En total se realizaron 504 entrenamientos para cada estación.

Tabla 2. 

Diseño de las configuraciones donde h_act.: función de activación de la capa oculta, o_act.: función de activación de la capa de salida, cant_neuronas: cantidad de neuronas de la capa oculta.

Configuraciónh_acto_actcant_neuronas
1,2sigmoidsigmoid64,128
3,4softsignsigmoid64,128
5,6softmaxsigmoid64,128
7,8sigmoidsoftsign64,128
9,10softsignsoftsign64,128
11,12softmaxsoftsign64,128
13,14sigmoidsoftmax64,128
15,16softsignsoftmax64,128
17,18softmaxsoftmax64,128

Estadígrafos usados para la evaluación

Para comprobar la actuación del MRNA, fue posible calcular diferentes estadígrafos. Fueron utilizados el Error Máximo (e_max) (1), el Error Absoluto Medio (mae) (2), el Error Cuadrático Medio (mse) (3), la Desviación Estándar (desv_est) (4 y 5) y el Coeficiente de Correlación de Pearson (p_corr) (6). Las expresiones de cada uno se escriben seguidamente, para ello se adopta la notación: observado (O), pronosticado (P) y cantidad de datos a comparar (N). El error está dado por e = O − P y una barra superior indica valor medio.

Herramientas de programación utilizadas

Se empleó el lenguaje de programación Python 2.7, el cual es administrado por la Python Software Foundation. Posee una licencia de código abierto, denominada Python Software Foundation License, que es compatible con la Licencia Pública General de GNU a partir de la versión 2.1.1, e incompatible con ciertas versiones anteriores. Además se utiliza la plataforma de aprendizaje automático Tensorflow, que es un desarrollo open-source (código abierto) de Google que va más allá de la Inteligencia Artificial, pero su flexibilidad y gran comunidad de desarrolladores lo han posicionado como la herramienta líder en el sector del Deep Learning (Aprendizaje Profundo), según (Buhigas, 2018). Tensorflow es la plataforma de Aprendizaje Profundo más importante del mundo; y la librería Keras, la cual es una biblioteca creada en 2015 para facilitar la creación de aplicaciones de Redes Neuronales con mecanismos de Aprendizaje Profundo.

DISCUSIÓN DE LOS RESULTADOS

El análisis de los distintos experimentos y configuraciones probadas, se presenta a continuación. En las Figuras 2-5, se muestran los diagramas de Taylor por cada estación y los experimentos que mostraron los mejores resultados. Se observa que, en todos los casos, es el experimento 13 el que muestra una mejor correlación. Esto indica que con el uso de un solo plazo de predicción y calculando el acumulado en 24 horas para entrenar la red, se obtiene un mejor ajuste.

Figura 2. 

Diagrama de Taylor (325)

Figura 3. 

Diagrama de Taylor (333)

Figura 4. 

Diagrama de Taylor (342)

Figura 5. 

Diagrama de Taylor (355)

En relación a las 18 configuraciones utilizadas con cada experimento, en la Tabla 3, se muestra el mejor par (experimento-configuración). En este caso, se muestra el que brinda la mayor varianza explicada de los datos.

Tabla 3. 

Mejor par experimento-configuración

ExperimentoConfiguración
Costa Norte (Casablanca, 325)1310
Costa Sur (Playa Girón, 333)1310
Montaña (Topes de Collantes, 342)131
Interior (Camagüey, 355)1310

Producto de la complejidad de la variable en estudio, es de esperar que el mejor período para el entrenamiento sea el acumulado en 24 horas, debido a que al procesar los datos de entrada del modelo de red se tomaron, para cada día, valores trihorarios en hora local (valores 1,4,7,10,13,16,19 y 22) en los datos medidos en las estaciones; por tal motivo se comenzaron a tomar los valores del WRF a las 06 UTC, correspondiente con el primer valor de cada día en las estaciones (valor 1). El acumulado de precipitación a las 06 UTC se ve afectado si se consideran los plazos anteriores (03 y 00) debido a que son instancias de calentamiento del modelo numérico, y esto puede afectar en el comportamiento de la red neuronal; sin embargo, al utilizar acumulado en 24 horas, a pesar de que disminuye la cantidad de datos para el entrenamiento, se logra una mejor relación entre los datos de entrada del modelo de red y al mismo tiempo un mejor resultado durante el entrenamiento. Por otra parte, la normalización de los datos disminuye la variabilidad de los mismos, pues todos los valores se encuentran en el intervalo [0,1] y de esta forma aumenta considerablemente la efectividad durante el entrenamiento. Es posible, una vez entrenado el modelo, regresar a los valores reales mediante la operación inversa de la transformación.

Los mejores resultados para la estación 342 se obtuvieron con la configuración #1(h_act: “sigmoid”, o_act: “sigmoid”, cant_neuronas: “64”); mientras que el resto de las estaciones (325, 333 y 355) aportaron los mejores resultados con la configuración #10 (h_act: “softsign”, o_act: “softsign”, cant_neuronas: “128”).

Error permitido durante el entrenamiento

En la Tabla 4 se muestra el error y la precisión permitidos durante el entrenamiento y la validación (train_loss y val_loss respectivamente), la precisión lograda por el modelo de red al entrenar (train_acc) y validar (val_acc), así como la evaluación del modelo con los datos que no fueron usados para entrenar (test_score y test_acc). Estos pares fueron escogidos mediante una selección de los mejores resultados de cada entrenamiento. El modelo de red en cada configuración comenzaba el entrenamiento con una varianza explicada (var_exp) de los datos igual a 10-5, y se guardaba el modelo obtenido; luego, al terminar la fase de entrenamiento, comparaba la varianza explicada obtenida durante la validación, y en caso de ser mayor que la existente, se reemplazaba el modelo guardado.

Tabla 4. 

Fase de entrenamiento

(325)(333)(342) (355)
train_loss (mm)0.01230.01010.00760.0146
val_loss (mm)0.01730.00990.01950.0320
train_acc0.72370.75600.50520.6316
val_acc0.47170.52830.37500.5472
test_score0.01120.00830.00580.0077
test_acc0.63630.78780.56560.5909
var_exp6.23%13.38%34.46%19.03%

Evaluación del modelo de red

Para la evaluación del MRNA se utilizaron los valores correspondientes a los meses comprendidos entre noviembre de 2018 y febrero de 2019. Se realizó, para cada estación, la evaluación de los resultados con el mejor esquema obtenido durante la validación, obteniendo zonas de mejor desempeño para cada uno de los modelos (WRF y red neuronal).

Actuación del modelo WRF

En la Tabla 5 se observa que el modelo numérico obtiene los mejores resultados para la estación de interior (355), respecto a todos los estadígrafos calculados, evidenciando su habilidad para el pronóstico en las zonas de menor complejidad del terreno. El peor desempeño se da en la estación ubicada en la costa Norte (325), debido a que en el período de estudio (noviembre 2018-febrero 2019), hubo presencia de sistemas frontales en esta zona, ocasionando la mayor actividad de precipitación y como consecuencia, los mayores errores del modelo.

Tabla 5. 

Estadígrafos (WRF)

(325)(333)(342) (355)
e_max (mm)128.7087.1060.9022.70
mae3.312.142.571.34
mse189.9484.7876.4515.21
desv_est13.548.5111.06.50
p_corr0.190.100.640.87

Comparación entre ambos modelos

A continuación, se muestra, por cada estación, la comparación entre el modelo WRF (SisPI) y el modelo de red (MLP). Se analizan los estadígrafos calculados y las diferencias entre ambos, utilizando color verde con signo positivo (+) en los aspectos favorables, y color rojo con signo negativo (-) en los desfavorables.

Tabla 6. 

Estación Camagüey 355.

SisPIMLPdif (SisPI-MLP)
e_max (mm)22.7017.72+4.98
mae1.342.04-0.70
mse15.218.79+6.42
desv_est6.503.21+3.29
p_corr0.870.65-0.22

Tabla 7. 

Estación Topes de Collantes 342

SisPIMLPdif (SisPI-MLP)
e_max (mm)60.9025.25+35.65
mae2.572.26+0.31
mse76.4516.72+59.73
desv_est11.002.66+8.34
p_corr0.640.67+0.03

Tabla 8. 

Estación Casablanca 325

SisPIMLPdif (SisPI-MLP)
e_max (mm)128.7052.48+76.22
mae3.313.72-0.41
mse189.9456.49+133.45
desv_est13.546.41+7.13
p_corr0.190.27+0.08

Tabla 9. 

Estación Playa Girón 333

SisPIMLPdif (SisPI-MLP)
e_max (mm)87.1023.78+63.32
mae2.142.72-0.58
mse84.7818.64+66.14
desv_est8.511.63+6.88
p_corr0.100.34+0.24

En cuanto a las medidas de error, no existe una marcada diferencia en el error absoluto medio (mae) para cada estación; mientras que la corrección del error cuadrático medio (mse) es significativa en todas las estaciones, mostrando la diferencia entre el estimador y lo que se estima. Este error es una función de riesgo correspondiente al valor esperado de la pérdida cuadrática; la mayor diferencia se produce debido a la aleatoriedad e incorpora tanto la varianza del estimador como su sesgo. Se puede observar que, a pesar de corregirse en todas las estaciones, la peor actuación del modelo de red en cuanto a este estadígrafo, se tiene en la estación 355 (la corrección es inferior a 10 mm), que es donde mejor habilidad presenta el WRF; mientras que, en el resto de las estaciones, la corrección fue superior a los 50 mm de precipitación. Si se analiza la desviación estándar (desviación que presentan los datos en su distribución respecto de la media aritmética de dicha distribución), el modelo de red logra corregir este estadígrafo en todas las estaciones, mostrando la mejor actuación en la estación 342 al disminuir, en gran medida, el grado de dispersión de los datos con respecto al valor promedio. El coeficiente de correlación de Pearson establece el grado de relación de dos variables siempre y cuando ambas sean cuantitativas. En todas las estaciones se tiene que 0 < p_corr < 1 (para ambos modelos), indicando que existe una correlación positiva; sin embargo, exceptuando la estación de Camagüey, el modelo de red logra mejorar este coeficiente en todas las estaciones. Al comparar las Tablas 6, 7, 8 y 9 se observa que la mejor actuación del modelo de red se obtiene en la estación de Topes de Collantes, en la cual todos los estadígrafos fueron mejorados, lo que indica que la red presenta gran habilidad para representar la precipitación en terrenos de orografía compleja. Sin embargo, en Camagüey, Casablanca y Playa Girón, el error absoluto medio (mae) que cometen ambos modelos es similar (la diferencia es menor que 1 mm), por lo que se puede concluir que a modo general, el modelo de red logra corregir, de manera efectiva, el pronóstico cuantitativo promedio (en todo el período de evaluación) de la precipitación obtenido por el modelo WRF.

Luego de ver el comportamiento medio del modelo de red en relación al obtenido por el WRF, se presentan los resultados para cada estación seleccionada de manera que se pueda ver en detalle la corrección lograda o no. En cada figura se muestra, para cada día del período estudiado, el acumulado de precipitación en 24 horas. Los meses en estudio se colocan uno a continuación del otro (noviembre y diciembre de 2018, enero y febrero de 2019) y se enumeran los días de cada mes, correspondiendo el primer valor de las abscisas, al día 4 de noviembre de 2018.

En la estación 355 (ver Figura 6) se observan dos valores significativos en enero (días 5 y 20) y uno el 14 de febrero. En los dos primeros tanto el WRF como el modelo de red sobreestiman el valor observado de precipitación, mostrando este último modelo, una corrección de aproximadamente 12 mm. En el tercer caso, se reportó en la estación alrededor de 40 mm de precipitación, y el comportamiento de los modelos fue opuesto en cuanto a estimación y similar en cuanto a corrección, lo que evidencia la similitud presentada entre ambos en el error máximo que cometen.

Figura 6. 

En el panel superior se muestra el acumulado de precipitación en 24 horas desde el 4 de noviembre de 2018 hasta el 28 de febrero de 2019, correspondiente a la estación 355; se utilizan los colores azul, negro y rojo para el modelo WRF (SisPI), las estaciones (ESTACIONES) y el modelo de red (MLP) respectivamente. En el panel inferior se muestra el sesgo.

En la estación 342 (ver Figura 7), de acuerdo con los datos observados, hubo dos acumulados significativos reportados en el mes de noviembre: el día 8 (aproximadamente 25 mm) y el día 28 (aproximadamente 18 mm). En el primero, el WRF sobreestima el pronóstico de la precipitación en 20 mm, mientras que la corrección aplicada con la red neuronal subestima el acumulado en 10 mm, siendo modularmente menor que el error cometido por el WRF. El segundo día el WRF no detectó la ocurrencia de precipitación en esa estación, y en este caso la red neuronal falló en la corrección del pronóstico. El mismo comportamiento ocurre para otros días en los que el modelo WRF falla al pronosticar la ocurrencia del evento de lluvia. Esto indica que cuando el WRF no pronostica presencia de precipitación, la red no es capaz de corregir este fallo. Entre el 16 y el 22 de diciembre se observa una sobreestimación del pronóstico por parte del WRF; mientras que el modelo de red en el primer caso (17 de diciembre) también sobreestima (en menor medida) el valor observado. Por otro lado, el 21 de diciembre la red neuronal subestima el valor real, permitiendo un mayor error. Esto indica que cuando el modelo numérico sobreestima la precipitación, la red ajusta considerablemente bien; sin embargo, cuando subestima, la red no es capaz de corregir el error cometido por el modelo. Esto se debe a que el WRF tiende con mayor frecuencia, a sobreestimar el acumulado de precipitación, por lo que la red aprende mejor a corregir la sobreestimación durante el entrenamiento y no las otras situaciones descritas.

Figura 7. 

En el panel superior se muestra el acumulado de precipitación en 24 horas desde el 4 de noviembre de 2018 hasta el 28 de febrero de 2019, correspondiente a la estación 342; se utilizan los colores azul, negro y rojo para el modelo WRF (SisPI), las estaciones (ESTACIONES) y el modelo de red (MLP) respectivamente. En el panel inferior se muestra el sesgo.

Tanto en la estación 325 (Figura 8 (a)) como en la estación 333 (Figura 4 (b)), el comportamiento de ambos modelos es similar en cuanto a la tendencia a subestimar o sobreestimar la precipitación. En ambas figuras se observa que el modelo de red mejora, de manera significativa, los eventos de sobreestimación del modelo WRF. Además, se observa la incapacidad de corrección del pronóstico de precipitación, en los casos en que el WRF no detectó la ocurrencia de precipitación reportada en las estaciones (por ejemplo, el 20 de enero en ambas estaciones). Se evidencia la habilidad del modelo de red para corregir sobreestimación (23 de noviembre en la costa Norte y 8 de noviembre en Gran Piedra) y la dificultad que presenta en la corrección de subestimaciones (24 de enero en 325 y 14 de diciembre en 333).

Figura 8. 

Se muestra el comportamiento del WRF, el MLP y el los valores observados de la precipitación para las estaciones 325 (a) y 333 (b). En el panel superior se muestra el acumulado de precipitación en 24 horas desde el 4 de noviembre de 2018 hasta el 28 de febrero de 2019, se utilizan los colores azul, negro y rojo para el modelo WRF (SisPI), las estaciones (ESTACIONES) y el modelo de red (MLP) respectivamente. En el panel inferior se muestra el sesgo.

CONCLUSIONES

  1. En esta investigación se cumplen los objetivos propuestos, logrando, en el período de estudio y en todas las estaciones analizadas, la corrección del pronóstico cuantitativo de la precipitación mediante el uso de redes neuronales.

  2. Se determina, para cada estación analizada, el modelo de redes neuronales a utilizar para la corrección del pronóstico de precipitación.

  3. El modelo de red neuronal tiene una gran habilidad para mejorar la mayoría de los estadígrafos estudiados, en especial, el error cuadrático medio, donde se logra una mejora, con respecto al modelo numérico, de más de 50 mm en tres de las cuatro estaciones analizadas. En la restante, a pesar de ser la estación donde mejor se desempeña el modelo numérico, se logra una corrección de 6 mm aproximadamente. El peor desempeño se obtiene en el error absoluto medio, no obstante, la diferencia entre ambos modelos es inferior a 1 mm.

  4. Cuando el modelo numérico sobreestima el acumulado de precipitación, la red neuronal ajusta considerablemente bien; sin embargo, cuando se subestiman los valores, la red no es capaz de corregir en gran medida el error cometido por el modelo WRF. Además, cuando el WRF no pronostica la presencia de precipitación, el modelo de red no es capaz de corregir este fallo.

 

REFERENCIAS

Bishop, C. M. 1995. Neural Networks for Pattern Recognition. Oxford: University Press, 1995.

Buhigas, J. 2018. Todo lo que necesitas saber sobre TensorFlow, la plataforma para Inteligencia Artificial de Google. Puentes Digitales. [Online] 2 14, 2018. [Cited: 3 2018, 20.] https://puentesdigitales.com/author/javierbuhigas/ .

Castillo, E., et al. 1999. An Introduction to Functional Networks with Applications. Boston: s.n., 1999.

Cofiño, A. S., Gutirrez, J. M. and Ivanissevich, M. L. 2004. Evolving modular networks with genetic algorithms. Application to nonlinear time series. 2004.

Cybenko, G. 1989. Aproximation by supperpositions of a sigmoidal function. 1989. pp. 203-314.

Grell, G.A. and Freitas, S. R. 2013. A scale and aerosol aware stochastic convective parameterization for weather and air quality modeling. 2013. pp. 23845-23893.

Gutierrez, J. M., et al. 2004. Redes Probabilísticas y Neuronales en las Ciencias Atmosféricas. Instituto Nacional de Meteorología, Universidad de Cantabria: s.n., 2004.

Haykin, S. 1998. Neural Networks: A Comprehensive Foundation. 2, 1998.

Hidalgo, H. G., Dettinger, M. D. and Cayan, D. R. 2008. Downscaling with constructed analogues: Daily precipitation and temperature fields over the United States. Report, 2007-027, California Climate Change Center. Program California Energy Commission : Public Interest Energy Research (PIER), 2008, p. 48.

Hsieh, W. W. and Tang, B. 1998. Applying neural network models to prediction and data analysis in meteorology and oceanography. 1998. pp. 1855-1870.

Manual del WRF. 2004. Mesoscale & Microscale Meteorology Division, ARW Version 3 Modeling System User’s Guide. Complementary to the ARW Tech Note. Colorado, USA: NCAR: Boulder, 2004, p. 411.

Sanaz, M. 2015. Bias Correction of Global Circulation Model Outputs Using Artificial Neural Networks. Instituto de Tecnología de Georgia: s.n., 2015.

Schizas, C. N., Pattichis, C. S. and Michaelides, S.C. 1994. Artificial neural networks in weather forecasting. 1994. pp. 219-230.

Sierra, L. M., et al. 2014. Sistema de Predicción a muy corto plazo basado en el Acoplamiento de Modelos de Alta Resolución y Asimilación de Datos. 2014.

 

 

 

 

Los autores de este trabajo declaran no presentar conflicto de intereses.

Los autores de este trabajo declaran presentar una participación igualitaria en la concepción, ejecución y escritura de la investigación.

Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons