FILLING OF FAULTS IN CLIMATOLOGICAL AIR TEMPERATURE SERIES IN BRAZILIAN STATE CAPITALS FROM 1980 TO 2017
Keywords:
Climatological Series. Neural networks. Arima. Multiple Regression.Abstract
Air temperature is a key variable used to assess climate change. It is essential for many applications and impact studies in science. However, missing values in observed air temperature time series are quite common, which jeopardize its use for climate studies. In order to fill in missing maximum and minimum temperatures data from 21 stations from 1980 to 2017 in the main Brazilian capitals, we used three models: multiple linear regression (MRL), artificial neural network (ANN), and the autoregressive integrated moving average (ARIMA). In the annual averages, the ANN and MLR models presented a better performance in filling the missing data as compared to the ARIMA model, especially for maximum temperature. Seasonally, ANN overestimated the maximum and minimum temperatures, but it and the MLR model presented the best results (R²> 0.7) for all seasons, except winter. The ANN was the most suitable model to fill the missing data of maximum and minimum temperatures, even though it could be improved with the increase of the training on its networks. This study contributes to the understanding of essential methodologies for the use of climatic time series.
Downloads
References
AFRIFA‐YAMOAH, E. et al. Missing data imputation of high‐resolution temporal climate time series data. Meteorological Applications, v. 27, n. 1, 2020. doi:10.1002/met.1873
ALVARES, C. et al. Köppen’s climate classification map for Brazil. Meteorologische Zeitschrift, v. 22, n. 6, p. 711–728, 2013.
BIER, A. A.; FERRAZ, S. E. T. Comparação de metodologias de preenchimento de falhas em dados meteorológicos para estações no sul do Brasil. Revista Brasileira de Meteorologia, [S.l.], v. 32, n. 2, 215-226, 2017.
BOX, G.E.P.; JENKINS, G.M. Time series analysis forecasting and control, 2nd ed., San Francisco, Holden-Day, 1976.
BUUREN, S. V. Flexible imputation of missing data. [S.l.]: CRC press, 2012.
BUUREN, S. V.; OUDSHOORN, C. Multivariate imputation by chained equations. MICE V1.0 user's manual. Leiden: TNO Preventie en Gezondheid, 2000. 18, 31.
CAMELO, H. N. et al. Métodos de Previsão de Séries Temporais e Modelagem Híbrida ambos Aplicados em Médias Mensais de Velocidade do Vento para Regiões do Nordeste do Brasil. Revista Brasileira de Meteorologia, v. 32, n. 4, 565-574, 2017.
CHHABRA, C.; VASHISHT, V.; RANJAN, J. A. Comparison of Multiple Imputation Methods for Data with Missing Values. Indian Journal of Science and Technology, v. 10, n. 19, 2017.
CORREIA, T. P. et al. Aplicação de Redes Neurais Artificiais no Preenchimento de Falhas de Precipitação Mensal na Região Serrana do Espírito Santo. Geociências, v. 35, n. 4, p.560-567, 2016.
DALGAARD, P. Introductory Statistics with R. 2nd ed., Springer Verlag, 2008.
DANTAS, L. G.; SANTOS, C. A. C. dos.; OLINDA, R. A. de. Reamostragem de séries pluviométricas no estado da Paraíba. Revista Brasileira de Geografia Física, v. 09, n. 04, 997-1006, 2016.
DAS, K. R.; IMON, A. H. M. R. A Brief Review of Tests for Normality. American Journal of Theoretical and Applied Statistics, v. 5, n. 1, 5-12, 2016.
DEPINÉ, H.; CASTRO, N. M. R.; PEDROLLO, O. C. Incertezas no Preenchimento de Falhas de Chuvas Horárias com Redes Neurais Artificiais. Estudos Ambientais, v. 15, n. 2, p. 48-57, 2013.
DURBIN, J.; WATSON, G. S. Testing for serial correlation in Least squares Regression. III. Biometrika, v. 58, n. 11-19, 1971.
EL-MALLAH E.S.; ELSHARKAWY S.G. Time-series modeling and short term prediction of annual temperature trend on Coast Libya using the box-Jenkins ARIMA Model. Advances in Research, v. 6, n. 5, p. 1-11, 2016.
FILHO, D. F. F. et al. Aplicação de técnicas de interpolação para espacialização de chuvas da rede hidrográfica: estudo de caso Calha Norte – PA. Revista Brasileira de Climatologia, v. 24, 2019.
GÉRON, A. Hands-On Machine Learning with Scikit-Learn and TensorFlow. 1. ed. USA: O’Reilly Media, 2017.
GUJARATI, D.N.; PORTER, D.C. Basic Econometrics. Fourth Edition. McGraw-Hill, 922 p, 2009.
HALLAK, R.; PEREIRA FILHO, A. J. Metodologia para análise de desempenho de simulações de sistemas convectivos na região metropolitana de São Paulo com o modelo ARPS: sensibilidade a variações com os esquemas de advecção e assimilação de dados. Revista Brasileira de Meteorologia, v. 26, n. 4, p. 591–608, 2011.
HAYKIN, S.O. Neural Networks and Learning Machines. 3. ed. Upper Saddle River: Prentice Hall, 889 p. 2008.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA (IBGE). Áreas urbanizadas do Brasil. Série Relatórios Metodológicos. v. 44. Rio de Janeiro: IBGE, 2015.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA (IBGE). Classificação e caracterização dos espaços rurais e urbanos do Brasil: uma primeira aproximação. n. 11. Rio de Janeiro: IBGE, 2015.
INSTITUTO DE PESQUISA E ESTRATÉGIA ECONÔMICA DO CEARÁ (IPECE). Perfil municipal: Jaguaruana, 2017. Fortaleza: IPECE, 2018b.
INSTITUTO DE PESQUISA E ESTRATÉGIA ECONÔMICA DO CEARÁ (IPECE). Perfil geossocioeconômico: um olhar para as macrorregiões de planejamento do Estado do Ceará. Fortaleza: IPECE, 2014.
INSTITUTO DE PESQUISA E ESTRATÉGIA ECONÔMICA DO CEARÁ (IPECE). Perfil municipal: Fortaleza, 2017. Fortaleza: IPECE, 2018a.
KASHANI, M.H.; DINPASHOH, Y. Evaluation of efficiency of different estimation methods for missing climatological data. Stochastic Environmental Research and Risk Assessment, v. 26, n. 1, p. 59-71, 2012.
KEMP, W.P et al. Estimating missing daily maximum and minimum temperatures. Journal of climate and applied meteorology, v. 22, n. 9, 1587-1593, 1983.
KOUSKY, V. E. Frontal Influences on Northeast Brazil. Monthly Weather Review, v.107, p. 1140-1153, 1979.
LEAHY, P.; KIELY, G.; CORCORAN, G. Structural optimization and input selection of an artificial neural network for river level prediction. Journal Hydrology, v. 355, p. 192-201, 2008.
LEE, H.; KANG, K. Interpolation of Missing Precipitation Data Using Kernel Estimations for Hydrologic Modeling. Advances in Meteorology, v. 2015, 2015. doi.org/10.1155/2015/935868
MONTOGMERY, D. C.; JENNINGS, C. L.; KULAHCI, M. Introduction to Time Series Analysis and Forecasting. Wiley-intersciense, 2008.
MORETTIN, P. A., TOLOI, C. M. C. Análise de Séries Temporais. 2. ed. São Paulo: Edgard Blucher, 2006.
MURARA, P. G. Técnicas de interpolação para a pesquisa em climatologia regional e agroclimatologia. Ano 15. Edição Especial. XIII Simpósio Brasileiro de Climatologia Geográfica. Revista Brasileira de Climatologia, 2019.
MURAT, M. et al. Forecasting daily meteorological time series using ARIMA and regression models. International Agrophysics, v. 32, p. 253-264, 2018.
NEGNEVITSKY, M. Artificial Intelligence: A Guide to Intelligent Systems. 3. ed. Canada: Pearson Education, 2011.
NOGUEIRA, D. B.; DA SILVA, A. O.; DA SILVA, A. P. N. Comparação entre métodos de interpolação espacial para a estimativa da distribuição de precipitação no Ceará-Brasil. IRRIGA, v. 25, n. 1, p.131–142, 2020.
OLIVEIRA, L. F. C. de. et al. Comparação de metodologias de preenchimento de falhas de séries históricas de precipitação pluvial anual. Revista Brasileira de Engenharia Agrícola e Ambiental, v. 14, n. 11, p. 1186-1192, 2010.
PAPASTATHOUPOULOS, I.; TAWN, J A. A generalised Student’s t-distribution. Statistics and Probability Letters, v. 83, p. 70-77, 2013.
R CORE TEAM (2017). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.
R CORE TEAM (2018). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.
REBOITA, M. S. et al. Regimes de precipitação na América do Sul: uma revisão bibliográfica. Revista Brasileira de Meteorologia, v. 25, n. 2, p. 185–204, 2010.
RUSSELL, S.; NORVIG, P. Artificial Intelligence: A modern Aproach. 3. ed. USA: Pearson Education, 2010.
SALVIANO, M. F.; GROPPO, J. D.; PELLEGRINO, G. Q. Análise de Tendências em Dados de Precipitação e Temperatura no Brasil. Revista Brasileira de Meteorologia, v. 31, n. 1, p. 64-73, 2016.
SANCHES, F.; VERDUM, R.; FISCH, G. Preenchimento de falhas em séries de dados pluviométricos de Uruguaiana (RS) e análise de tendência. Disponível em: https://www.researchgate.net/publication/264082524>. Acesso em: 11 mai. 2018.
SAVIN, N. E. E WHITE, K. J. The Durbin-Watson test for serial correlation with extreme sample sizes or many regressors. Econometrica, v. 45, n. 8, p. 1989-1996, 1977.
SHAH, A. D. et al. Comparison of Random Forest and Parametric Imputation Models for Imputing Missing Data Using MICE: A CALIBER Study. American Journal of Epidemiology, v. 179, n. 6, 2014.
SHAPIRO, S. S.; WILK, M. B. An analysis of variance test for normality (complete samp1es). Biometrika, v. 52, n. 3 e 4, p. 591-611, 1965.
SHARMA, V.; RAI, S.; DEV, A. A comprehensive study of artificial neural networks. International Journal of Advanced Research in Computer Science and Software Engineering, vol. 2, n. 10, p. 278–284, 2012.
TABONY, R.C. The estimation of missing climatological data. Journal of Climatology, v. 3, n. 3, p. 297-314, 1983.
VENTURA, T. M. et al. Uma abordagem computacional para preenchimento de falhas em dados micrometeorológicos. Revista Brasileira de Ciências Ambientais, n. 27, 2013.
WADI, S. A.; ALMASARWEH, M.; ALSARAIREH, A. A. Predicting Closed Price Time Series Data Using ARIMA Model. Modern Applied Science, v. 12, n. 11; 2018.
WU, WEI; XU, AN-DING; LIU, HONG-BIN. High-resolution spatial databases of monthly climate variables (1961–2010) over a complex terrain region in southwestern China. Theoretical and Applied Climatology, v. 119, p. 353-362, 2014.
XAVIER, A. C.; KING, C. W.; SCANLON, B. R. Daily Gridded Meteorological Variables in Brazil (1980–2013). International Journal of Climatology, p. 2644–2659, 2016.
XIA, Y.; FABIAN, P.; STOHL, A.; WINTERHALTER, M. Forest climatology: estimation of missing values for Bavaria, Germany. Agricultural and Forest Meteorology, v. 96, p. 131-144, 1999.
YODAH WALTER. O.; KIHORO, J. M.; ATHIANY, K.H.O.; KIBUNJA H. W. Imputation of incomplete non- stationary seasonal time series data. Mathematical Theory and Modeling, v.3, n. 12, 2013.
Downloads
Published
How to Cite
Issue
Section
License
A aprovação dos artigos implica a aceitação imediata e sem ônus de que a Revista Brasileira de Climatologia terá exclusividade na primeira publicação do artigo. Os autores continuarão, não obstante, a deter os direitos autorais. Os autores autorizam também que seus artigos sejam disponibilizados em todos os indexadores aos quais a revista está vinculada.
Os autores mantém seus direitos de publicação sem restrições
A Comissão Editorial não se responsabiliza pelos conceitos ou afirmações expressos nos trabalhos publicados, que são de inteira responsabilidade dos autores.
A Revista Brasileira de Climatologia oferece acesso livre imediato ao seu conteúdo, seguindo o entendimento de que disponibilizar gratuitamente o conhecimento científico ao público proporciona maior democratização do conhecimento e tende a produzir maior impacto dos artigos publicados. Os artigos publicados na revista são disponibilizados segundo a Licença Creative Commons CC-BY-NC 4.0 (https://creativecommons.org/licenses/by-nc/4.0/). Segundo essa licença é permitido acessar, distribuir e reutilizar os artigos para fins não comerciais desde que citados os autores e a fonte. Ao submeter artigos à Revista Brasileira de Climatologia, os autores concordam em tornar seus textos legalmente disponíveis segundo essa licença