Simulação de valores ausentes em séries temporais de precipitação para avaliação de métodos de imputação
DOI:
https://doi.org/10.55761/abclima.v30i18.15243Palavras-chave:
Imputação de dados ausentes, Regressão linear múltipla, Redes neurais artificiais, HidrologiaResumo
Dados ausentes em séries temporais de precipitação são um dos principais problemas em estudos hidrológicos. Neste sentido, as técnicas de preenchimento de falhas constituem uma ferramenta importante para a reconstrução de conjuntos de dados pluviométricos. O objetivo do presente trabalho foi comparar diferentes métodos de preenchimento de falhas em séries mensais de precipitação. Como caso de estudo, foram consideradas séries temporais de 1974 a 2004 de estações pluviométricas localizadas na região do Cariri, Ceará, Brasil. Para a imputação dos valores ausentes, foram aplicados métodos como média aritmética (MA), inverso da potência da distância (IPD), ponderação regional (PR), regressão linear múltipla (RLM) e redes neurais artificiais (RNA). Utilizando os conceitos de mecanismos de ausência de dados, foram realizadas simulações de valores ausentes gerados artificialmente para diferentes porcentagens de falhas, a saber, 10% e 40%. O desempenho dos métodos de imputação foi avaliado por métricas de erro como a raiz do erro quadrático médio (REQM) e o erro absoluto médio (EAM). A sazonalidade do regime pluviométrico das séries também foi considerada. Numericamente, o método RNA obteve as menores médias de REQM e EAM, seguido pelos métodos RLM, PR, MA e IPD. Contudo, os valores médios obtidos por todos os métodos foram semelhantes. Os métodos avaliados foram capazes de estimar com boa precisão os dados faltantes na série pluviométrica estudada.
Downloads
Referências
AIEB, A.; MADANI, K.; SCARPA, M.; BONACCORSO, B.; LEFSIH, K. A new approach for processing climate missing databases applied to daily rainfall data in Soummam watershed, Algeria. Heliyon, v. 5, n. 2, 2019. DOI: https://doi.org/10.1016/j.heliyon.2019.e01247
ASGHARINIA, S.; PETROSELLI, A. A comparison of statistical methods for evaluating missing data of monitoring wells in the Kazeroun Plain, Fars Province, Iran. Groundwater for Sustainable Development, v. 10, p. 100294, 2020. DOI: https://doi.org/10.1016/j.gsd.2019.100294
AWAD, M.; KHANNA, R. Efficient learning machines: theories, concepts, and applications for engineers and system designers. Springer Nature, 2015. DOI: https://doi.org/10.1007/978-1-4302-5990-9
AYDILEK, I. B.; ARSLAN, A. A hybrid method for imputation of missing values using optimized fuzzy c-means with support vector regression and a genetic algorithm. Information Sciences, v. 233, p. 25-35, 2013. DOI: https://doi.org/10.1016/j.ins.2013.01.021
BECK, M. W.; BOKDE, N.; ASENCIO-CORTÉS, G.; KULAT, K. R package imputetestbench to compare imputation methods for univariate time series. The R journal, v. 10, n. 1, p. 218, 2018. DOI: https://doi.org/10.32614/RJ-2018-024
BIELENKI JUNIOR, C.; SANTOS, F. M. D.; POVINELLI, S. C. S.; MAUAD, F. F. Alternative methodology to gap filling for generation of monthly rainfall series with GIS approach. RBRH, v. 23, 2018. DOI: https://doi.org/10.1590/2318-0331.231820170171
BIER, A. A.; FERRAZ, S. E. T. Comparação de metodologias de preenchimento de falhas em dados meteorológicos para estações no Sul do Brasil. Revista Brasileira de Meteorologia, v. 32, p. 215-226, 2017. DOI: https://doi.org/10.1590/0102-77863220008
BRUBACHER, J. P.; OLIVEIRA, G. G.; GUASSELLI, L. A. Preenchimento de Falhas e Espacialização de Dados Pluviométricos: Desafios e Perspectivas. Revista Brasileira de Meteorologia, v. 35, p. 615-629, 2020. DOI: https://doi.org/10.1590/0102-77863540067
COGERH. Plano de Monitoramento e Gestão dos Aquíferos da Bacia do Araripe: Estado do Ceará. Fortaleza: Companhia de Gestão dos Recursos Hídricos - COGERH, CE, 2009.
CORREIA, T. P.; DOHLER, R. E.; DAMBROZ, C. S.; BINOTI, D. H. B. Aplicação de redes neurais artificiais no preenchimento de falhas de precipitação mensal na região serrana do Espírito Santo. Geociências (São Paulo), v. 35, n. 4, p. 560-567, 2016.
EISCHEID, J. K.; PASTERIS, P. A.; DIAZ, H. F.; PLANTICO, M. S.; LOTT, N. J. Creating a serially complete, national daily time series of temperature and precipitation for the western United States. Journal of Applied Meteorology, v. 39, n. 9, p. 1580-1591, 2000. DOI: https://doi.org/10.1175/1520-0450(2000)039<1580:CASCND>2.0.CO;2
FERNANDEZ, M. N. Preenchimento de falhas em séries temporais. Universidade Federal do Rio Grande – FURG. Curso de Pós-Graduação em Engenharia Oceânica. Dissertação de Mestrado, 2007.
FUNCEME. Fundação Cearense de Meteorologia - FUNCEME. 2019. Pré-Estação: entenda o período que antecede a quadra chuvosa do Ceará. Disponível em: http://www.funceme.br/?p=5963. Acesso em: 02 de ago. de 2021.
FUNCEME. Fundação Cearense de Meteorologia - FUNCEME. 2021. Página inicial. Disponível em: http://www.funceme.br. Acessado em: 02 de ago. de 2021.
GAO, Y.; MERZ, C.; LISCHEID, G.; SCHNEIDER, M. A review on missing hydrological data processing. Environmental earth sciences, v. 77, n. 2, p. 1-12, 2018. DOI: https://doi.org/10.1007/s12665-018-7228-6
GÓMEZ-CARRACEDO, M. P.; ANDRADE, J. M.; LÓPEZ-MAHÍA, P.; MUNIATEGUI, S.; PRADA, D. A practical comparison of single and multiple imputation methods to handle complex missing data in air quality datasets. Chemometrics and Intelligent Laboratory Systems, v. 134, p. 23-33, 2014. DOI: https://doi.org/10.1016/j.chemolab.2014.02.007
GÜNTHER, F.; FRITSCH, S. Neuralnet: training of neural networks. R J., v. 2, n. 1, p. 30, 2010. DOI: https://doi.org/10.32614/RJ-2010-006
GUPTA, A.; LAM, M. S. Estimating missing values using neural networks. Journal of the Operational Research Society, v. 47, n. 2, p. 229-238, 1996. DOI: https://doi.org/10.1057/jors.1996.21
HAYKIN, S. Neural Networks: A comprehensive foundation. Prentice Hall, 1999.
HONGHAI, F.; GUOSHUN, C.; CHENG, Y.; BINGRU, Y.; YUMEI, C. A SVM regression based approach to filling in missing values. In: International Conference on Knowledge-Based and Intelligent Information and Engineering Systems. Springer, Berlin, Heidelberg, 2005. p. 581-587. DOI: https://doi.org/10.1007/11553939_83
HARMAN, B. I.; KOSEOGLU, H.; YIGIT, C. O. Performance evaluation of IDW, Kriging and multiquadric interpolation methods in producing noise mapping: A case study at the city of Isparta, Turkey. Applied Acoustics, v.112, p.147-157, 2016. DOI: https://doi.org/10.1016/j.apacoust.2016.05.024
JUNGER, W. L.; DE LEON, A. P. Imputation of missing data in time series for air pollutants. Atmospheric Environment, v. 102, p. 96-104, 2015. DOI: https://doi.org/10.1016/j.atmosenv.2014.11.049
JUNNINEN, H.; NISKA, H.; TUPPURAINEN, K.; RUUSKANEN, J.; KOLEHMAINEN, M. Methods for imputation of missing values in air quality data sets. Atmospheric Environment, v. 38, n. 18, p. 2895-2907, 2004. DOI: https://doi.org/10.1016/j.atmosenv.2004.02.026
KARAMOUZ, M.; NAZIF, S.; FALAHI, M. Hydrology and hydroclimatology: principles and applications. CRC Press, 2012. DOI: https://doi.org/10.1201/b13771
KASHANI, M. H.; DINPASHOH, Y. Evaluation of efficiency of different estimation methods for missing climatological data. Stochastic Environmental Research and Risk Assessment, v. 26, n. 1, p. 59-71, 2012. DOI: https://doi.org/10.1007/s00477-011-0536-y
KIM, J.; RYU, J. H. A Heuristic Gap Filling Method for Daily Precipitation Series. Water Resources Management, v. 30, n. 7, p. 2275-2294, 2016. DOI: https://doi.org/10.1007/s11269-016-1284-z
LEE, S.; LEE, K. K.; YOON, H. Using artificial neural network models for groundwater level forecasting and assessment of the relative impacts of influencing factors. Hydrogeology Journal, v. 27, n. 2, p. 567-579, 2019. DOI: https://doi.org/10.1007/s10040-018-1866-3
LIN, W. C.; TSAI, C. F. Missing value imputation: a review and analysis of the literature (2006–2017). Artificial Intelligence Review, v. 53, n. 2, p. 1487-1509, 2020. DOI: https://doi.org/10.1007/s10462-019-09709-4
LITTLE, R. J.; RUBIN, D. B. Statistical analysis with missing data. John Wiley & Sons, 2019. DOI: https://doi.org/10.1002/9781119482260
MACHIWAL, D.; JHA, M. K. Hydrologic time series analysis: theory and practice. Springer Science & Business Media, 2012. DOI: https://doi.org/10.1007/978-94-007-1861-6
MAITY, R. Statistical methods in hydrology and hydroclimatology. Springer, 2018. DOI: https://doi.org/10.1007/978-981-10-8779-0
MEKANIK, F.; IMTEAZ, M. A.; GATO-TRINIDAD, S.; ELMAHDI, A. Multiple regression and Artificial Neural Network for long-term rainfall forecasting using large scale climate modes. Journal of Hydrology, v. 503, p. 11-21, 2013. DOI: https://doi.org/10.1016/j.jhydrol.2013.08.035
MEKIS, E.; DONALDSON, N.; REID, J.; ZUCCONI, A; HOOVER, J.; LI, Q.; NITU, R.; MELO, S. An overview of surface-based precipitation observations at environment and climate change Canada. Atmosphere-Ocean, v. 56, n. 2, p. 71-95, 2018. DOI: https://doi.org/10.1080/07055900.2018.1433627
MELLO, Y. R.; KOHLS, W.; OLIVEIRA, T. M. N. Uso de diferentes métodos para o preenchimento de falhas em estações pluviométricas. Boletim de geografia, v. 35, n. 1, p. 112-121, 2017. DOI: https://doi.org/10.4025/bolgeogr.v35i1.30893
MORITZ, S.; SARDÁ, A.; BARTZ-BEIELSTEIN, T.; ZAEFFERER, M.; STORK, J. Comparison of different methods for univariate time series imputation in R. arXiv preprint arXiv:1510.03924, 2015.
NAGHETTINI, M.; PINTO, E. J. A. Hidrologia estatística. Belo Horizonte: CPRM, 2017.
OLIVEIRA, G. G.; PEDROLLO, O. C.; CASTRO, N. M. R.; BRAVO, J. M. Simulações hidrológicas com diferentes proporções de área controlada na bacia hidrográfica. Rev. Bras. Recur. Hídricos, v. 18, n. 3, p. 193-204, 2013. DOI: https://doi.org/10.21168/rbrh.v18n3.p193-204
PALIT, A. K.; POPOVIC, D. Computational Intelligence in Time Series Forecasting: Theory and engineering applications. Springer, 2005.
RADI, N. F. A.; ZAKARIA, R.; AZMAN, M. A. Z. Estimation of missing rainfall data using spatial interpolation and imputation methods. In: AIP conference proceedings. American Institute of Physics, 2015. p. 42-48. DOI: https://doi.org/10.1063/1.4907423
RUEZZENE, C. B.; MIRANDA, R. B.; TECH, A. R. B.; MAUAD, F. F. Preenchimento de falhas em dados de precipitação através de métodos tradionais e por inteligência artificial. Revista Brasileira de Climatologia. v. 29, p. 177-204, 2021.
SATTARI, M. T.; REZAZADEH-JOUDI, A.; KUSIAK, A. Assessment of different methods for estimation of missing data in precipitation studies. Hydrology Research, v. 48, n. 4, p. 1032-1044, 2017. DOI: https://doi.org/10.2166/nh.2016.364
SATTARI, M. T.; FALSAFIAN, K.; IRVEM, A.; QASEM, S. N. Potential of kernel and tree-based machine-learning models for estimating missing data of rainfall. Engineering Applications of Computational Fluid Mechanics, v. 14, n. 1, p. 1078-1094, 2020. DOI: https://doi.org/10.1080/19942060.2020.1803971
SEARCY, J. K.; HARDISON, C. H. Double-mass curves. US Government Printing Office, 1960.
TEAM, R. Core. R: A language and environment for statistical computing. 2021.
TEEGAVARAPU, R. S. V.; CHANDRAMOULI, V. Improved weighting methods, deterministic and stochastic data-driven models for estimation of missing precipitation records. Journal of hydrology, v. 312, n. 1-4, p. 191-206, 2005. DOI: https://doi.org/10.1016/j.jhydrol.2005.02.015
TEIXEIRA, F. J. C. Modelos de gerenciamento de recursos hídricos: análises e proposta de aperfeiçoamento do sistema do Ceará. Dissertação (Mestrado em Recursos Hídricos) - Universidade Federal do Ceará, Fortaleza, 2003.
TUCCI, C. E. M. Hidrologia: ciência e aplicação. Porto Alegre: Ed. UFRGS, 2001.
TWALA, B. An empirical comparison of techniques for handling incomplete data using decision trees. Applied Artificial Intelligence, v. 23, n. 5, p. 373-405, 2009. DOI: https://doi.org/10.1080/08839510902872223
ZHANG, G. P. An investigation of neural networks for linear time-series forecasting. Computers Operations Research, v. 28, n. 12, p. 1183–1202, 2001. DOI: https://doi.org/10.1016/S0305-0548(00)00033-2
Downloads
Publicado
Como Citar
Edição
Seção
Licença
A aprovação dos artigos implica a aceitação imediata e sem ônus de que a Revista Brasileira de Climatologia terá exclusividade na primeira publicação do artigo. Os autores continuarão, não obstante, a deter os direitos autorais. Os autores autorizam também que seus artigos sejam disponibilizados em todos os indexadores aos quais a revista está vinculada.
Os autores mantém seus direitos de publicação sem restrições
A Comissão Editorial não se responsabiliza pelos conceitos ou afirmações expressos nos trabalhos publicados, que são de inteira responsabilidade dos autores.
A Revista Brasileira de Climatologia oferece acesso livre imediato ao seu conteúdo, seguindo o entendimento de que disponibilizar gratuitamente o conhecimento científico ao público proporciona maior democratização do conhecimento e tende a produzir maior impacto dos artigos publicados. Os artigos publicados na revista são disponibilizados segundo a Licença Creative Commons CC-BY-NC 4.0 (https://creativecommons.org/licenses/by-nc/4.0/). Segundo essa licença é permitido acessar, distribuir e reutilizar os artigos para fins não comerciais desde que citados os autores e a fonte. Ao submeter artigos à Revista Brasileira de Climatologia, os autores concordam em tornar seus textos legalmente disponíveis segundo essa licença