COMPARAÇÃO ENTRE MÉTODOS DE IMPUTAÇÃO DE DADOS EM DIFERENTES INTENSIDADES AMOSTRAIS NA SÉRIE DE PRECIPITAÇÃO PLUVIAL DA ESALQ

Authors

  • Suelen Cristina Gasparetto Universidade de São Paulo - ESALQ/USP
  • Sônia Maria De Stefano Piedade Universidade de São Paulo - ESALQ/USP
  • Luiz Roberto Angelocci Universidade de São Paulo - ESALQ/USP
  • Vitor Augusto Ozaki Universidade de São Paulo - ESALQ/USP

Keywords:

Precipitação, Imputação múltipla, MICE, Comparação de métodos.

Abstract

Um problema frequente nas análises estatísticas de informações climatológicas é a ocorrência de dados faltantes, assim, o objetivo deste trabalho foi comparar três métodos de imputação de dados com observações da série de precipitação pluvial de uma estação climatológica convencional, no município de Piracicaba-SP, no período de 1917 a 1997, em diferentes intensidades amostrais (5%, 10% e 15%) de informações faltantes, geradas de forma aleatória. Para o “preenchimento” dessas informações, foram usados três métodos de imputação múltipla: PMM (Predictive Mean Matching), random forest e regressão linear, via método bootstrap, em cada intensidade amostral de informações faltantes. A comparação entre cada procedimento de imputação foi feita, por meio da raiz do erro quadrático médio, índice de acurácia de Willmott e o índice de desempenho. O método, que resultou em menores valores da raiz quadrada dos erros e maiores índices de desempenho e acurácia, foi o PMM, em especial, na intensidade de 10% de informações faltantes. O índice de desempenho, para os três métodos de imputação de dados, em todas as intensidades de observações faltantes, foi considerado insatisfatório, por isso, é necessária uma atenção maior quando se trata de observações tão variáveis espacialmente e temporalmente quanto as chuvas.

Downloads

Download data is not yet available.

References

ALVES, L. E. R.; GOMES, H. B. Validação da imputação múltipla via Predictive Mean Matching para preenchimento de falhas nos dados pluviométricos da Bacia do Médio São Francisco. Anuário do Instituto de Geociências, Rio de Janeiro, v. 43, n. 1, p. 199–206, 2020.

BALDISERA, R. S.; DALLACORT, R. Influência das variáveis climáticas: declinação solar, fotoperíodo e irradiação no topo da atmosfera, em regiões agricultáveis do Brasil. Revista de Ciências Agro-Ambientais, Alta Floresta, v. 15, n. 2, p. 109–115, 2017.

BREIMAN, L. Random forests. Machine Learning, Boca Raton, v. 45, n. 1, p. 5–32, 2001.

BURHANUDDIN, S. N. Z.; DENI, S. M.; RAMLI, N. M. Normal ratio in multiple imputation based on bootstrapped sample for rainfall data with missingness. International Journal of GEOMATE, New York, v. 13, n. 36, p. 131–137, ago. 2017.

CAMARGO, Â. P. de; SENTELHAS, P. C. Avaliação do desempenho de diferentes métodos de estimativa da evapotranspiração potencial no Estado de São Paulo, Brasil. Revista Brasileira de Agrometeorologia, Santa Maria, v. 5, n. 6, p. 89–97, jan. 1997.

CAMELO, H. do N.; LUCIO, P. S.; LEAL JÚNIOR, J. V. Modelagem da velocidade do vento usando metodologias ARIMA, Holt-Winters e RNA na previsão de geração eólica no nordeste brasileiro. Revista Brasileira de Climatologia, v. 21, n. 13, p. 449–466, jul./dez. 2017.

CARVALHO, J. R. P. de et al. Modelo de imputação múltipla para estimar dados de precipitação diária e preenchimento de falhas. Revista Brasileira de Meteorologia, São José dos Campos, v. 32, n. 4, p. 575–583, out./dez. 2017.

CHEN, H. et al. A spatiotemporal estimation method for hourly rainfall based on F-SVD in the recommender system. Environmental Modelling & Software, Oxford, v. 144, p. 1-11, out. 2021.

CHEN, L. et al. Comparison of the multiple imputation approaches for imputing rainfall data series and their applications to watershed models. Journal of Hydrology, [Amsterdam], v. 572, p. 449–460, mai. 2019.

CONSTANTINO, G. C.; BRUNINI, O. Caracterização do regime de evapotanspiração real, em escala decendial, no Estado de São Paulo. Revista Brasileira de Meteorologia, São José dos Campos, v. 22, n. 1, p. 75–82, abr. 2007.

EFRON, B.; TIBSHINRANI, R. J. An introduction to the Bootstrap. New York: Chapman & Hall, p. 452, 1993.

ESPINOSA, L. A.; PORTELA, M. M.; RODRIGUES, R. Spatio-temporal variability of droughts over past 80 years in Madeira Island. Journal of Hydrology: regional studies, [Amsterdam], v. 25, p. 1-18, out. 2019.

GARCÍA-PEÑA, M.; ARCINIEGAS-ALARCÓN, S.; BARBIN, D. Imputação de dados climáticos utilizando a decomposição por valores singulares: uma comparação empírica. Revista Brasileira de Meteorologia, São José dos Campos, v. 29, n. 4, p. 527–536, dez. 2014.

GUEDES, H. A. S.; PRIEBE, P. dos S.; MANKE, E. B. Tendências em séries temporais de precipitação no norte do estado do Rio Grande do Sul, Brasil. Revista Brasileira de Meteorologia, São José dos Campos, v. 34, n. 2, p. 283–291, abr./jun. 2019.

HUI, D. et al. Gap-filling missing data in eddy covariance measurements using multiple imputation (MI) for annual estimations. Agricultural and Forest Meteorology, [Amsterdam], v. 121, n. 1–2, p. 93–111, jan. 2004.

JARDIM, C. H.; MOURA, F. P. de. Variações dos totais de chuvas e temperatura do ar na bacia do Rio Pandeiros, norte do estado de Minas Gerais - Brasil: articulação com fatores de diferentes níveis escalares em áreas de transição climática de cerrado para semiárido. Revista Brasileira de Climatologia, n. 14, p. 172–189, nov. 2018.

LEITÃO, N.; CARVALHO, L. Considerações sobre a construção e análise de séries longas de precipitação em Cernache do Bonjardim, Sertã, Portugal, 1916/2021. Revista Pensar Acadêmico, Manhuaçu, v. 19, n. 3, p. 654–685, set./dez. 2021.

LITTLE, R. J. A. Missing-data adjustments in large surveys missing-data ad ustments in large surveys. Journal of Business & Economic Statistics, [Washington, DC], v. 6, n. 3, p. 287–296, jul. 1988.

MITAL, U. et al. Sequential imputation of missing spatio-temporal precipitation data using random forests. Frontiers in Water, Lausanne, v. 2, n. 20, p. 1–15, 2020.

OLIVEIRA, H. L. C. de; OLIVEIRA, S. R. de M.; MONTEIRO, J. E. B. de A. Geração de séries temporais de dados meteorológicos utilizando algoritmo de aprendizado de máquina. In: CONGRESSO INTERINSTITUCIONAL DE INICIAÇÃO CIENTÍFICA, 11., 2017, Campinas. Anais [...]. Campinas: Embrapa, p. 262–267, 2017.

POSTO METEOROLÓGICO “PROFESSOR JESUS MARDEN DOS SANTOS” ESALQ - USP. Tempo em Piracicaba. Posto Meteorológico, Piracicaba, 2020. Disponível em: http://www.leb.esalq.usp.br/posto/index.html. Acesso em: 27 ago. 2020.

RAIMUNDO, C. do C.; SANSIGOLO, C. A.; MOLION, L. C. B. Tendências das classes de precipitação na Região Metropolitana de São Paulo. Revista Brasileira de Meteorologia, São José dos Campos, v. 29, n. 3, p. 397–408, set. 2014.

R CORE TEAM. R: a language and environment for statistical computing. Vienna: R Foundation for Statistical Computing, 2017. Disponível em: http://www.r-project.org/. Acesso em: 25 jul. 2021.

REBOITA, M. S. et al. Aspectos climáticos do estado de Minas Gerais. Revista Brasileira de Climatologia, v. 17, n. 11, p. 206–226, jul./dez. 2015.

RICCE, W. da S. et al. Zoneamento agroclimático da cultura do abacaxizeiro no Estado do Paraná. Semina: ciências agrarias, Londrina, v. 35, n. 4, p. 2337–2346, 2014.

RUBIN, D. B. Multiple imputation for nonresponse in surveys. New York: John Wiley & Sons, p. 258, 1987.

RUIZ-CÁRDENAS, R.; KRAINSKI, E. T. Preenchimento de falhas em bancos de dados meteorológicos diários: uma comparação de abordagens. In: CONGRESSO BRASILEIRO DE AGROMETEOROLOGIA, 17., 2011, Guarapari. Anais [...]. Guarapari: SESC, p. 1-5, 2011.

SAHA, A. et al. A hybrid spatio-temporal modelling: an application to space-time rainfall forecasting. Theoretical and Applied Climatology, Wien, v. 142, n. 3–4, p. 1271–1282, set. 2020.

SANTOS, R. S. dos et al. Caracterização de extremos mensais de precipitação em Cacoal (RO). Revista Brasileira de Climatologia, v. 22, n. 14, p. 267–268, jan./jun. 2018.

SANTOS, T. V. dos et al. Estimativa da evapotranspiração na mesorregião do baixo São Francisco. Revista Brasileira de Meteorologia, São José dos Campos, v. 35, p. 981–993, out./dez. 2020.

SENA, J. P. de O. et al. Comparação entre dados de chuva derivados do Climate Prediction Center e observados para a região do Cariri Paraibano. Revista Brasileira de Geografia Física, Pernambuco, v. 5, n. 2, p. 412–420, 2012.

SILVA, D. S. B. S. et al. Imputação de dados diários de radiação solar global via ambiente R. Enciclopédia Biosfera, Goiânia, v. 16, n. 29, p. 957–969, 2019.

SOUZA, E. B. de et al. Padrões climatológicos e tendências da precipitação nos regimes chuvoso e seco da Amazônia Oriental. Revista Brasileira de Climatologia, v. 21, n. 13, p. 81–93, jul./dez. 2017.

SOUZA, E. de O. et al. Estimativa e espacialização da erosividade em mesorregiões climáticas no estado de Alagoas. Revista Brasileira de Meteorologia, São José dos Campos, v. 35, p. 769–783, out./dez. 2020.

VAN BUUREN, S. Flexible imputation of missing data. New York: Chapman & Hall, p. 316, 2012.

VAN BUUREN, S.; GROOTHUIS-OUDSHOORN, K. MICE: Multivariate Imputation by Chained Equations in R. Journal of Statistical Software, [California], v. 45, n. 3, p. 1–68, dez. 2011.

VICENTE, M. R. et al. Evapotranspiração de referência utilizando o método FAO Penman-Monteith com dados faltantes. Global Science and Technology, Rio Verde, v. 11, n. 3, p. 217–228, set./dez. 2018.

WILLMOTT, C. J. et al. Statistics for the evaluation and comparison of models. Journal of Geophysical Research, Hoboken, v. 90, n. C5, p. 8995–9005, set. 1985.

WILLMOTT, C. J.; MATSUURA, K. Advantages of the mean absolute error (MAE) over the root mean square error (RMSE) in assessing average model performance. Climate Research, Oldendorf/Luhe, v. 30, p. 79–82, dez. 2005.

How to Cite

Gasparetto, S. C., Piedade, S. M. D. S., Angelocci, L. R., & Ozaki, V. A. (2021). COMPARAÇÃO ENTRE MÉTODOS DE IMPUTAÇÃO DE DADOS EM DIFERENTES INTENSIDADES AMOSTRAIS NA SÉRIE DE PRECIPITAÇÃO PLUVIAL DA ESALQ. Brazilian Journal of Climatology, 29, 464–489. Retrieved from https://ojs.ufgd.edu.br/rbclima/article/view/15426

Issue

Section

Artigos