Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRRJ |
Texto Completo: | https://rima.ufrrj.br/jspui/handle/20.500.14407/14321 |
Resumo: | Obtergrandes volumes de dados meteorológicos de qualidade e livre de falhas são grandes desafios para estudos climáticos ambientais.O estudo de dados pluviométricos é de grande importância no dia a dia, pois viabiliza o entendimento da variabilidade espacial da precipitação em uma região ou bacia hidrográfica o que possibilita determinar o período e avaliar a probabilidade da ocorrência de eventos extremos, sendo de suma importância para as ações associadas ao planejamento urbano, industrial e agropecuário, além do uso racional dos recursos hídricos.No Brasil, eles são obtidos a partir de estações meteorológicas, geograficamente distribuídasem todo território e fornecidos por vários órgãos, principalmente, peloInstituto Nacional de Meteorologia (INMET)e pela Agência Nacional de Águas (ANA).No entanto, obter dados estruturados curados de qualidade e livre de falhas é um problema que ainda é estudado por diversos autores. Assim, detectar e preencher as falhas encontradas nos dados é um passo importante para o controle de qualidade. Neste sentido, este trabalho estuda e aplica o método de validação cruzada para a seleção dos métodos de interpolação (regressão linear, ponderação regional, inverso do quadrado da distância e ponderação regional com base em regressões lineares) no preenchimento de falhasde longas séries de dados pelo uso em workflows científicos. Para controlar, integrar e produzir essa massa de dados curados, as tarefas de computação se apoiaram na execução de experimentos científicosin silico voltados para a área da Meteorologia baseadas no paradigma dos workflows científicos, que capturaram descritores de proveniência, que auxiliam na rastreabilidade dos dados e processos, e assim, revelam como foram produzidos, e, ainda, asseguram a qualidade da metodologia aplicada. Esta pesquisa propôs, modelou e avaliou umworkflow científico com base em experimentos computacionais capazes de manipular grandes volumes de dados meteorológicos brutos, transformando-os em curados e estabelecendo sua proveniência. Além disso, a proposta consiste em armazená-los na base de dados compatível com o sistema Meteoro desenvolvido previamente pelo nosso grupo de pesquisas.Neste processo foram analisados os dados hidrológicos de 34 estações pluviométricas (séries com no mínimo 10 anos), de 77 inicialmente selecionadas e,dentre os métodos avaliados o que apresentou melhores resultados foi o da ponderação regional (PR). |
id |
UFRRJ-1_71ea5d997959b47ff887cfdd136f0eca |
---|---|
oai_identifier_str |
oai:rima.ufrrj.br:20.500.14407/14321 |
network_acronym_str |
UFRRJ-1 |
network_name_str |
Repositório Institucional da UFRRJ |
repository_id_str |
|
spelling |
Tomaz, Ulisses RoqueCruz, Sérgio Manuel Serra da848.488.637-91http://lattes.cnpq.br/7618571401128973Gregório, Ronaldo Malheiros077.117.167-61http://lattes.cnpq.br/4502104424266743Santos, Ednaldo Oliveira dosManhães, Laci Mari Barbosa019.285.167-50http://lattes.cnpq.br/30154498880517742023-12-22T02:59:56Z2023-12-22T02:59:56Z2016-09-19TOMAZ, Ulisses Roque. Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos. 2016. 117 f. Dissertação (Mestrado em Modelagem Matemática e Computacional) - Instituto de Ciências Exatas, Universidade Federal Rural do Rio de Janeiro, Seropédica - RJ, 2016.https://rima.ufrrj.br/jspui/handle/20.500.14407/14321Obtergrandes volumes de dados meteorológicos de qualidade e livre de falhas são grandes desafios para estudos climáticos ambientais.O estudo de dados pluviométricos é de grande importância no dia a dia, pois viabiliza o entendimento da variabilidade espacial da precipitação em uma região ou bacia hidrográfica o que possibilita determinar o período e avaliar a probabilidade da ocorrência de eventos extremos, sendo de suma importância para as ações associadas ao planejamento urbano, industrial e agropecuário, além do uso racional dos recursos hídricos.No Brasil, eles são obtidos a partir de estações meteorológicas, geograficamente distribuídasem todo território e fornecidos por vários órgãos, principalmente, peloInstituto Nacional de Meteorologia (INMET)e pela Agência Nacional de Águas (ANA).No entanto, obter dados estruturados curados de qualidade e livre de falhas é um problema que ainda é estudado por diversos autores. Assim, detectar e preencher as falhas encontradas nos dados é um passo importante para o controle de qualidade. Neste sentido, este trabalho estuda e aplica o método de validação cruzada para a seleção dos métodos de interpolação (regressão linear, ponderação regional, inverso do quadrado da distância e ponderação regional com base em regressões lineares) no preenchimento de falhasde longas séries de dados pelo uso em workflows científicos. Para controlar, integrar e produzir essa massa de dados curados, as tarefas de computação se apoiaram na execução de experimentos científicosin silico voltados para a área da Meteorologia baseadas no paradigma dos workflows científicos, que capturaram descritores de proveniência, que auxiliam na rastreabilidade dos dados e processos, e assim, revelam como foram produzidos, e, ainda, asseguram a qualidade da metodologia aplicada. Esta pesquisa propôs, modelou e avaliou umworkflow científico com base em experimentos computacionais capazes de manipular grandes volumes de dados meteorológicos brutos, transformando-os em curados e estabelecendo sua proveniência. Além disso, a proposta consiste em armazená-los na base de dados compatível com o sistema Meteoro desenvolvido previamente pelo nosso grupo de pesquisas.Neste processo foram analisados os dados hidrológicos de 34 estações pluviométricas (séries com no mínimo 10 anos), de 77 inicialmente selecionadas e,dentre os métodos avaliados o que apresentou melhores resultados foi o da ponderação regional (PR).Researchers face several challenges in order to handle large volumes of high-quality meteorological data, free of missing (or gaps). The detailed comprehension of rainfall temporal data is important in daily activities such as in the evaluation of the distribution of rain in a given area. The proper study of such dataset may aid administrators in planning cities, industries and farmlands. In Brazil, meteorological dataset is collect by meteorological rainfall stations that are spread in the geographic space. Part of such dataset are maintained Agência Nacional de Águas (ANA) by means of HidroWeb system. Activities like detect and fill temporal series gaps are crucial to control the quality of meteorological data. This dissertation presents a computational approach based on scientific workflows and crossvalidation and interpolation methods to face the above-mentioned challenges. The interpolation methods we have used in this dissertation are linear regression,regional weighting, inverse square distance, regional weighting with linear regression. The scientific workflows we have developed are able to use the four methods to generate large volumes of high meteorological data; they are also able to collect retrospective provenance from the in silico experiments. Our experiments evaluated dataset from 34 (from 77) meteorological rainfall stations which the temporal serial has at least ten years of data. Our experimental results showed that the best results were achieved with PR methodapplication/pdfporUniversidade Federal Rural do Rio de JaneiroPrograma de Pós-Graduação em Modelagem Matemática e ComputacionalUFRRJBrasilInstituto de Ciências ExatasWorkflow científicovalidação cruzadaproveniênciaScientific workflowcross-validationprovenanceMatemáticaTratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicosTreatment of large volumes of hydrometeorological data supported by cross-validation in scientific workflowsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis(COOPERATIVE INFORMATION SYSTEMS). 1. ed. Massachusetts, MIT Press, 2002. ALTINTAS, I.; BERKLEY, C.; JAEGER, E.; JONES, M.; LUDASCHER, B.; MOCK, S.. KEPLER: AN EXTENSIBLE SYSTEM FOR DESIGN AN EXECUTION OF SCIENTIFIC WORKFLOWS.In:Scientific and Statistical Database Management, p. 423-424, Grécia, 2004. AMORIM, R. C. F.; RIBEIRO, A.; LEITE, C. C.; LEAL, B. G.; SILVA, J. B. G.. AVALIAÇÃO DO DESEMPENHO DE DOIS MÉTODOS DE ESPACIALIZAÇÃO DA PRECIPITAÇÃO PLUVIAL PARA O ESTADO DE ALOGOAS. Acta Scientiarum. Technology, v.30, n. 1, p. 87-91, 2008. ANA – AGÊNCIA NACIONAL DE ÁGUAS. EVOLUÇÃO DA REDE HIDROMETEOROLÓGICA NACIONAL. Brasília: ANA, 2007. ANA – AGÊNCIA NACIONAL DE ÁGUAS. INVENTÁRIO DAS ESTAÇÕES PLUVIOMÉTRICAS. Brasília, 2ª ed. ANA; SGH, 2009. ANA – AGÊNCIA NACIONAL DE ÁGUAS. DIRETRIZES E ANÁLISES RECOMENDADAS PARA CONSISTÊNCIA DE DADOS PLUVIOMÉTRICOS. Superintendência de Gestão de Rede Hidrometeorológica. Brasília: ANA, SGH 2011. ANA – AGÊNCIA NACIONAL DE ÁGUAS. CONJUNTURA DOS RECURSOS HÍDRICOS NO BRASIL: REGIÕES HIDROGRÁFICAS BRASILEIRAS. ed. Especial Brasília: ANA, 2015. BARBOSA, S. E. S.; BARBOSA JUNIOR, A. R.; SILVA, G. Q.; CAMPOS, E. N. B.; RODRIGUES, V. C.. GERAÇÃO DE MODELOS DE REGIONALIZAÇÃO DE VAZÕES MÁXIMAS, MÉDIAS DE LONGO PERÍODO E MÍNIMAS DE SETE DIAS PARA A BACIA DO RIO DO CARMO, MINAS GERAIS. Engenharia Sanitária e Ambiental , v. 10, p. 64-71, 2005. BARROS, A. J. P.; LEHFELD, N. A. S..PROJETO DE PESQUISA: PROPOSTAS METODOLÓGICAS. 8.ed. Petrópolis. Vozes, 95 p. 1999. BERTONI, J. C., TUCCI, C. E. M..PRECIPITAÇÃO. In: TUCCI, C. E. M. Hidrologia: Ciência e Aplicação. Porto Alegre, UFRGS. p. 177-241. 2007. CALLAHAN, S. P.; FREIRE. J.; SANTOS, E.; SCHEIDEGGER, C. E.; SILVA, C. T.; VO, H. T..VISTRAILS: VISUALIZATION MEETS DATA MENAGEMENT. In:Proc. SIGMOD 2006, p. 745-747, USA, 2006. CONGIUSTA, A.; GRECO, G.; GUZZO, A.; MANCO, G.; PONTIERI, L.; SACCA, D.; TALIA, D..A DATA MINING-BASED FRAMEWORK FOR GRID WORKFLOW MANAGEMENT, in Proc. 5th International Conference on Quality Software (QSIC '05), p. 349–356, IEEE Computer Society Press, 2005. CRUZ, S. M. S..UMA ESTRATÉGIA DE APOIO À GERÊNCIA DE DADOS DE PROVENIÊNCIA EM EXPERIMENTOS CIENTÍFICOS. Tese de Doutorado. PESC/COPPE-UFRJ. Rio de Janeiro, 2011. DAVIDSON, S. B.; FREIRE, J.. PROVENANCE AND SCIENTIFIC WORKFLOWS: CHALLENGES AND OPPORTUNITIES. In:ACM SIGMOD International Conference on Management of Data, p. 1345-1350, Vancouver, Canada. 2008. DEELMAN, E.; MEHTA, G.; SINGH, G.; SU, M.; VAHI, K.; PEGASUS: MAPPING LARGE-SCALE WORKFLOWS TO DISTRIBUTED RESOURCES. In:Workflows for e-Science,Springer, p. 376-394, 2007. DEELMAN, E.; CHERVENAK, A.. DATA MANAGEMENT CHALLENGES OF DATA-INTENSIVE SCIENTIFIC WORKFLOWS. In: Proc. Of theEighth IEEE International Symposium on Cluster Computing and the Grid,Washington, DC, p. 687-692, 2008. 53 DEELMAN, E.; GANNON, D.; SHIELDS, M.; TAYLOR, I.. WORKFLOWS AND E-SCIENCE: AN OVERVIEW OF WORKFLOW SYSTEM FEATURES AND CAPABILITIES, In: Future Generation Computer Systems, v. 25, n. 5, p. 528-540, 2009. DIERBACH, C.. INTRODUCTION TO COMPUTER SCIENCE USING PYTHON: A COMPUTACIONAL PROBLEM-SOLVING FOCUS. Wiley, USA, 2013. EAGLESON, P. S.. THE EVOLUTION OF MODERN HYDROLOGY (FROM WATERSHED TO CONTINENT IN 30 YEARS), MIT Colloquium on Hydroclimatology and Global Hydrology, In: Advances in Water Resources, v. 17, n. 1, p. 3-18, ISSN 0309-1708, 1994. EISCHEID, J. K.; BAKER, C. B.; KARL, T.; DIAZ, H. F.. THE QUALITY CONTROL OF LONG-TERM CLIMATOLOGICAL DATA USING OBJECTIVE DATA ANALYSIS. In: Journal of Applied Meteorology. v. 34, n. 12, 1995. EFRON, B.. THE JACKNIFE, THE BOOTSTRAP AND OTHER RESAMPLING PLANS. CBMS National Science Monograph 38, Society of Industrial and Applied Mathematics, 1982. FAHRINGER, T., PRODAN, R., DUAN, R., HOFER, J., NADEEM, F., NERIERI, F., PODLIPNIG, S., QIN, J., SIDDIQUI, M., TRUONG, H.-L., VILLAZÓN, A., WIECZOREK, M.. ASKALON: A DEVELOPMENT AND GRID COMPUTING ENVIRONMENT FOR SCIENTIFIC WORKFLOWS. In TAYLOR, I. J., DEELMAN, E., GANNON, D. B., and SHIELDS, M., editors. Workflows for e-Science, chapter 27, p. 450– 471. Springer, 2007. FENG, S.; HU, Q.; QIAN, W.. QUALITY CONTROL OF DAILY METEOROLOGICAL DATA IN CHINA 1951 -2000: A NEW DATASET. In: Internacional Journal of Climatology. v.24, p. 853-870, 2004. FERRARI, A. T.. METODOLOGIA DA PESQUISA CIENTÍFICA. São Paulo, McGraw-Hill, 1982. FERRARI, G. T.. IMPUTAÇÃO DE DADOS PLUVIOMÉTRICOS E SUA APLICAÇÃO NA MODELAGEM DE EVENTOS EXTREMOS DA SECA AGRÍCOLA. Dissertação de Mestrado - USP, Piracicaba, 2011. FREIRE, J.; KOOP, D.; SANTOS, E.; SILVA, C. T.. PROVENANCE FOR COMPUTATIONAL TASKS: A SURVEY, Computing in Science &Engineering,IEEE Educational Activities Department, Piscataway, NJ, USA,v. 10, n. 3, p. 11-21, 2008. FURLAN, D. N.. VARIABILIDADE TEMPORAL E ESPACIAL DA CHUVAS E DO BALANÇO HÍDRICO NO ESTADO DE RONDÔNIA: CARACTERIZAÇÃO E ANÁLISE DE TENDÊNCIA. Dissertação de Mestrado. Escola Superior de Agricultura Luiz de Queiroz, 2009. GARCEZ, L. N.; ALVAREZ, G. A.. HIDROLOGIA.2º Ed. Rev. e Atual. São Paulo: Blucher, 1988. GIL, A. C. MÉTODOS E TÉCNICAS DE PESQUISA SOCIAL. 5. ed. São Paulo: Atlas, 1999. GOBLE, C.. POSITION STATEMENT: MUSINGS ON PROVENANCE, WORKFLOW AND (SEMANTIC WEB). Annotations for Bioinformatics. In: Workshop on Data Derivation and Provenance, Chicago, 2002. GODERIS, A.; SATTLER, U.; LORD, P.; GOBLE, C.. SEVEN BOTTLENECKS TO WORKFLOW REUSE AND REPURPOSING. In:The Semantic Web – ISWC 2005. LNCS 3729, pp 323-337, Springer-Verlag Berlin Heidelberg, 2005. GOECKS, J.; NEKRUTENKO, A.; TAYLOR, J.; GALAXY TEAM, T.. GALAXY: A COMPREHENSIVE APPROACH FOR SUPPORTING ACCESSIBLE, REPRODUCIBLE, AND TRANSPARENT COMPUTATIONAL RESEARCH IN THE LIFE SCIENCES.Genome biology, v. 11, n. 8, p. 1, 2010. 54 GRAY, J. JIM GRAY ON ESCIENCE: A TRANSFORMED SCIENTIFIC METHOD. In: HEY, T.; TANSLEY, S.; TOLLE, K. (Ed.). The Fourth Paradigm: Data-Intensive Scientific Discovery. Washington: Microsoft Research, 2009. GREENWOOD, M.; GOBLE, C.; STEVENS, R.; ZHAO, J.; ADDIS, M.; MARVIN, D.; MOREAU, L.; OINN, T.. PROVENANCE OF E-SCIENCE EXPERIMENTS - EXPERIENCE FROM BIOINFORMATICS. In:Proc.The UK OST e-Science 2nd AHM 2003, Nottingham, UK, p. 223-226, 2003. GURU, S. M.; KEARNEY, M.; FITCH, P.; PETERS, C. CHALLENGES IN USING SCIENTIFIC WORKFLOW TOOLS IN THE HYDROLOGY DOMAIN. 18th World IMACS Congress and MODSIM09, International Congress on Modelling and Simulation. Cairns, Australia, p. 3514-3520, 2009. HOLLINGSWORTH, D.. THE WORKFLOW REFERENCE MODEL. WORKFLOW MANAGEMENT COALITION, Hampshire, UK, 1995. HULL, D.; WOLSTENCROFT, K.; STEVENS, R.; GOBLE, C.; POCOCK, M. R.; LI, P.; OINN, T.. TAVERNA: A TOOL FOR BUILDING AND RUNNING WORKFLOWS OF SERVICES.Nucleic Acids Research, v. 34, n. 2, p. 729-732, 2006. INMET - INSTITUTO NACIONAL DE METEOROLOGIA. NORMAIS CLIMATOLÓGICAS DO BRASIL / 1961-1990. 2013. INMET – INSTITUTO NACIONAL DE METEOROLOGIA., Disponível em: <http://www.inmet.gov.br/portal/index.php?r=home2/index >. Acesso em 14 de julho de 2016. JAGADISH, H. V.; OLKEN, F.. DATABASE MANAGEMENT FOR LIFE SCIENCES RESEARCH. In:ACM SIGMOD Record, New York, USA, v. 33, n. 2, p. 15-20, 2004. KOHAVI, R.. A STUDY OF CROSS-VALIDATION AND BOOTSTRAP FOR ACCURACY ESTIMATION AND MODEL SELECTION. In:Proc. 14th International Joint Conference on Artificial Intelligence – v. 2 (IJCAI'95). Morgan Kaufmann Publishers Inc., San Francisco, CA, USA, p. 1137-1143, 1995. LAKATOS, E. M.; MARCONI, M. A. METODOLOGIA CIENTIFICA. 2a . ed. São Paulo: EditoraAtlas. 242 p. 1991. LEGATES, D. R.; MCCABE JR., G. J. EVALUATING THE USE OF “GOODNESS-OF-FIT” MEASURES IN HYDROLOGIC AND HYDROCLIMATIC MODEL VALIDATION. In: Water Resources Research, v.35, n.1, p.233-241, 1999. LEMOS FILHO, G. R.; PRECINOTO, R. S.; CORREIA, T. P.; SANTOS, E. O.; LYRA, G. B.; CRUZ, S. M. S.. ASSIMILAÇÃO, CONTROLE DE QUALIDADE E ANÁLISE DE DADOS METEOROLÓGICOS APOIADOS POR PROVENIÊNCIA. In: Anais do XXXIII Congresso da Sociedade Brasileira de Computação, 2013 LIM, C.; LU, S.; CHEBOTKO, A.; FOTOUHI, F.. PROSPECTIVE AND RETROSPECTIVE PROVENANCE COLLECTION IN SCIENTIFIC WORKFLOW ENVIRONMENTS. In:Services Computing (SCC), IEEE International Conference on, Miami, FL, p. 449-456, 2010. MAGINA, F. C.. AQUISIÇÃO AUTOMÁTICA E TRATAMENTO DE DADOS METEOROLÓGICOS APLICÁVEIS AO PROJETO E OPERAÇÃO DE LINHAS AÉREAS DE TRANSMISSÃO DE ENERGIA ELÉTRICA. Dissertação (Mestrado), Universidade Federal de Itajubá. 2007. MARINHO, A.; MURTA, L.; WERNER, C.; BRAGANHOLO, V.; CRUZ, S. M. S. da; MATTOSO, M.. A STRATEGY FOR PROVENANCE GATHERING IN DISTRIBUTED SCIENTIFIC WORKFLOWS. In:IEEE International Workshop on Scientific Workflows, p. 344-347, Los Angeles, California, United States. 2009. MARK, L. ASCHER, D. APRENDENDO PYTHON. 2 ed. Porto Alegre: Bookman, 2007. 55 MATTOS, A.; SILVA, F. C.; RUBERG, N.; CRUZ, S. M. S. da.; MATTOSO, M. L. Q.. GERÊNCIA DE WORKFLOWS CIENTÍFICOS: UMA ANÁLISE CRÍTICA NO CONTEXTO DA BIOINFORMÁTICA. Coppe/UFRJ, PESC, Technical Report Es-716/08. 2008. MATTOSO, M.; WERNER, C.; TRAVASSOS, G. H.; BRAGANHOLO, V.; MURTA, L.; OGASAWARA, E.; OLIVEIRA, F.; MARTINHO, W.. DESAFIOS NO APOIO À COMPOSIÇÃO DE EXPERIMENTOS CIENTÍFICOS EM LARGA ESCALA. In:Seminário Integrado de Software e Hardware (XXXVI SEMISH), p. 307-321, 2009. MCKINNEY, W.. PYTHON FOR DATA ANALYSIS. 2 ed. O'Reilly Media, Inc., Sebastopol, CA, USA. 2013. MELLO, C. R.; SILVA, A. M. da..MODELAGEM ESTATÍSTICA DA PRECIPITAÇÃO MENSAL E ANUAL E NO PERÍODO SECO PARA O ESTADO DE MINA GERAIS.Revista brasileira de Engenharia Agrícola e Ambiental, v.13, n.1, p.68-74, 2009. MOREAU, L.; GROTH, P.; MILES, S.; VÁZQUEZ-SALCEDA, J.; IBBOTSON, J.; JIANG, S.; MUNROE, S.; RANA, O.; SCHREIBER, A.; TAN, V.; VARGA, LASZLO.. THE PROVENANCE OF ELECTRONIC DATA. Commun. ACM, New York, v. 51, n. 4, p. 52-58, 2008. NAGHETTINI, M.; PINTO, E. J. A.. HIDROLOGIA ESTATÍSTICA. Belo Horizonte. CPRM, 2007. OINN, T.; LI, P.; KELL, D. B.; GOBLE, C.; GODERIS, A.; GREENWOOD, M.; HULL, D.; STEVENS, R.;TURI, D.; ZHAO, J.. TAVERNA/MYGRID: ALIGNING A WORKFLOW SYSTEM WITH THE LIFE SCIENCES COMMUNITY. In:Workflows for e-Science, Springer, p. 300-319, 2007. OGASAWARA, E. S.. UMA ABORDAGEM ALGÉBRICA PARA WORKFLOWS CIENTÍFICOS COM DADOS EM LARGA ESCALA. Tese de Doutorado. PESC/COPPE-UFRJ. Rio de Janeiro, 2011. OLIVEIRA, L. F. C.; FIOREZE, A. P.; MEDEIROS, A. M. M.; SILVA, M. A. S.. COMPARAÇÃO DE METODOLOGIAS DE PREENCHIMENTO DE FALHAS DE SÉRIES HISTÓRICAS DE PRECIPITAÇÃO PLUVIAL ANUAL.In:XVI Congresso Brasileiro de Agrometeorologia. Belo Horizonte. 2009. OLIVEIRA, D.; OGASAWARA, E.; CHIRIGATI, F.; SOUSA, V.; MURTA, L.; WERNER, C.; MATTOSO, M.. UMA ABORDAGEM SEMÂNTICA PARA LINHAS DE EXPERIMENTOS CIENTÍFICOS USANDO ONTOLOGIAS. In:III e-Science workshop - XXIV SBBD & XXIII SBES, 2009a. PRUSKI, F. F.; PEREIRA, S. B.; NOVAES, L. F.; SILVA, D. D.; RAMOS, M. M. PRECIPITAÇÃO MÉDIA ANUAL E VAZÃO ESPECÍFICA MÉDIA DE LONGA DURAÇÃO, NA BACIA DO SÃO FRANCISCO. Revista Brasileira de Engenharia Agrícola e Ambiental, v.8, n.2/3, p.247-253, 2004. SILVA, C. E. P; OLIVEIRA, D.; CRUZ, S. M. S.; CAMPOS, M. L. M.; MATTOSO, M.. CAPTURA DE METADADOS DE PROVENIÊNCIA PARA WORKFLOWS CIENTÍFICOS EM NUVENS COMPUTACIONAIS. In:Anais do XXV Simpósio Brasileiro de Bancos de Dados, p. 215-223, Belo Horizonte, 2010. SILVA, C. T.; ANDERSON, E.; SANTOS, E.; FREIRE, J.. USING VISTRAILS AND PROVENANCE FOR TEACHING SCIENTIFIC VISUALIZATION. The Eurographics Association, 2010a. SILVA, F. C.. TRATAMENTO E PREENCHIMENTO DE FALHAS DE SÉRIES DE DADOS METEOROLÓGICOS UTILIZANDO WORKFLOWS CIENTÍFICOS PARALELOS EM AMBIENTES DE CPU. Dissertação de Mestrado, UFRRJ/PPGMMC, 2014. SILVA, F. D. S.; RAMOS, R. M.; COSTA, R. L.; AZEVEDO, P. V.. SISTEMA DE CONTROLE DE QUALIDADE PARA DADOS DIÁRIOS DE VARIÁVEIS METEOROLÓGICAS. Revista Brasileira de Geografia Física, vol, 07, n. 05, 2014a. 56 SIMMHAN, Y. L.; PLALE, B.; GANNON, D.. A SURVEY OF DATA PROVENANCE IN e-SCIENCE. ACM SIGMOD, v.34, p. 31-36, New York, USA. 2005. SNEE, R. D.. VALIDATION OF REGRESSION MODELS: METHODS AND EXAMPLES. In:Technometrics, v. 19, n 4. 1977. TAYLOR, I. J.; DEELMAN, E.; GANNON, D. B.; SHIELDS, M.. WORKFLOWS FOR e-SCIENCE: SCIENTIFIC WORKFLOWS FOR GRIDS. 1 ed. Springer. 2007. TAYLOR, I.; SHIELDS, M.; WANG, I.; HARRISON, A.. THE TRIANA WORKFLOW ENVIRONMENT: ARCHITECTURE AND APPLICATIONS.In:Workflows for e-Science, Springer, p. 320-339, 2007a. TRAVASSOS, G. H.; BARROS, M. O. CONTRIBUTIONS OF IN VIRTUO AND IN SILICO EXPERIMENTS FOR THE FUTURE OF EMPIRICAL STUDIES IN SOFTWARE ENGINEERING, In:Proc. of the WSESE03, Fraunhofer IRB Verlag, Roma. 2003. WAGNER, P. D.; FIENER, P.; WILKEN, F.; KUMAR, S.; SCHNEIDER, K.. COMPARISON AND EVALUATION OF SPATIAL INTERPOLATION SCHEMES FOR DAILY RAINFALL IN DATA SCARCE REGIONS. Journal of Hydrology. vol 464-465. p. 388-400, 2012. WISSMANN, J. A.; TAMPELINI, L. G.; FEIL, A. D.; SAMPAIO, S. C.; SUSZEK, M. FERRAMENTA COMPUTACIONAL PARA ANÁLISE DE CONSISTÊNCIA DE DADOS PLUVIOMÉTRICOS. Varia Scientia, p.99-106, 2006. WMO. WORLD METEOROLOGICAL ORGANIZATION. Disponível em <http://www.wmo.int/pages/index_en.html>. Acesso em 19 Jul. 2016. ZHAO, Y.; HATEGAN, M.; CLIFFORD, B.; FOSTER, I.; VON LASZEWSKI, G.; NEFEDOVA, V.; RAICU, I.; STEF-PRAUN, T.; WILDE, M.. SWIFT: FAST, RELIABLE, LOOSELY COUPLED PARALLEL COMPUTATION. In:Proc. of the 3rd IEEE World Congress on Services, p. 199-206, Salt Lake City, USA, 2007. ZUCCHINI, W.. AN INTRODUCTION TO MODEL SELECTION. Journal of Mathematical Psychology, Volume 44, Issue 1, Pages 41-61, ISSN 0022-2496, 2000.https://tede.ufrrj.br/retrieve/9320/2016%20-%20Ulisses%20Roque%20Tomaz.pdf.jpghttps://tede.ufrrj.br/retrieve/15780/2016%20-%20Ulisses%20Roque%20Tomaz.pdf.jpghttps://tede.ufrrj.br/retrieve/22092/2016%20-%20Ulisses%20Roque%20Tomaz.pdf.jpghttps://tede.ufrrj.br/retrieve/28476/2016%20-%20Ulisses%20Roque%20Tomaz.pdf.jpghttps://tede.ufrrj.br/retrieve/34892/2016%20-%20Ulisses%20Roque%20Tomaz.pdf.jpghttps://tede.ufrrj.br/retrieve/41288/2016%20-%20Ulisses%20Roque%20Tomaz.pdf.jpghttps://tede.ufrrj.br/retrieve/47690/2016%20-%20Ulisses%20Roque%20Tomaz.pdf.jpghttps://tede.ufrrj.br/retrieve/54126/2016%20-%20Ulisses%20Roque%20Tomaz.pdf.jpghttps://tede.ufrrj.br/jspui/handle/jspui/2592Submitted by Celso Magalhaes (celsomagalhaes@ufrrj.br) on 2019-02-26T15:32:13Z No. of bitstreams: 1 2016 - Ulisses Roque Tomaz.pdf: 20967061 bytes, checksum: 1f4def6f15f5b8861307d659a73e7bff (MD5)Made available in DSpace on 2019-02-26T15:32:13Z (GMT). No. of bitstreams: 1 2016 - Ulisses Roque Tomaz.pdf: 20967061 bytes, checksum: 1f4def6f15f5b8861307d659a73e7bff (MD5) Previous issue date: 2016-09-19info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRRJinstname:Universidade Federal Rural do Rio de Janeiro (UFRRJ)instacron:UFRRJTHUMBNAIL2016 - Ulisses Roque Tomaz.pdf.jpgGenerated Thumbnailimage/jpeg2104https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14321/1/2016%20-%20Ulisses%20Roque%20Tomaz.pdf.jpgc4715912a635b5fbde63d2a9b070733fMD51TEXT2016 - Ulisses Roque Tomaz.pdf.txtExtracted Texttext/plain181481https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14321/2/2016%20-%20Ulisses%20Roque%20Tomaz.pdf.txtaae91fe099bebc6bf1b0c58a2e663b1fMD52ORIGINAL2016 - Ulisses Roque Tomaz.pdfUlisses Roque Tomazapplication/pdf20967061https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14321/3/2016%20-%20Ulisses%20Roque%20Tomaz.pdf1f4def6f15f5b8861307d659a73e7bffMD53LICENSElicense.txttext/plain2089https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14321/4/license.txt7b5ba3d2445355f386edab96125d42b7MD5420.500.14407/143212023-12-21 23:59:56.503oai:rima.ufrrj.br:20.500.14407/14321Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSP1BSSUEgTElDRU4/QQpFc3RhIGxpY2VuP2EgZGUgZXhlbXBsbyA/IGZvcm5lY2lkYSBhcGVuYXMgcGFyYSBmaW5zIGluZm9ybWF0aXZvcy4KCkxJQ0VOP0EgREUgRElTVFJJQlVJPz9PIE4/Ty1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YT8/byBkZXN0YSBsaWNlbj9hLCB2b2M/IChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSA/IFVuaXZlcnNpZGFkZSAKWFhYIChTaWdsYSBkYSBVbml2ZXJzaWRhZGUpIG8gZGlyZWl0byBuP28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdSAKZGlzdHJpYnVpciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhPz9vIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyP25pY28gZSAKZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zID91ZGlvIG91IHY/ZGVvLgoKVm9jPyBjb25jb3JkYSBxdWUgYSBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZT9kbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byAKcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhPz9vLgoKVm9jPyB0YW1iP20gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGM/cGlhIGEgc3VhIHRlc2Ugb3UgCmRpc3NlcnRhPz9vIHBhcmEgZmlucyBkZSBzZWd1cmFuP2EsIGJhY2stdXAgZSBwcmVzZXJ2YT8/by4KClZvYz8gZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byA/IG9yaWdpbmFsIGUgcXVlIHZvYz8gdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgCm5lc3RhIGxpY2VuP2EuIFZvYz8gdGFtYj9tIGRlY2xhcmEgcXVlIG8gZGVwP3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGE/P28gbj9vLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3U/bS4KCkNhc28gYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jPyBuP28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jPyAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzcz9vIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgPyBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgCm9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbj9hLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3Q/IGNsYXJhbWVudGUgCmlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IG5vIGNvbnRlP2RvIGRhIHRlc2Ugb3UgZGlzc2VydGE/P28gb3JhIGRlcG9zaXRhZGEuCgpDQVNPIEEgVEVTRSBPVSBESVNTRVJUQT8/TyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0M/TklPIE9VIApBUE9JTyBERSBVTUEgQUc/TkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTyBRVUUgTj9PIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0M/IERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJUz9PIENPTU8gClRBTUI/TSBBUyBERU1BSVMgT0JSSUdBPz9FUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpIApkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGE/P28sIGUgbj9vIGZhcj8gcXVhbHF1ZXIgYWx0ZXJhPz9vLCBhbD9tIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2VuP2EuCg==Biblioteca Digital de Teses e Dissertaçõeshttps://tede.ufrrj.br/PUBhttps://tede.ufrrj.br/oai/requestbibliot@ufrrj.br||bibliot@ufrrj.bropendoar:2023-12-22T02:59:56Biblioteca Digital de Teses e Dissertações da UFRRJ - Universidade Federal Rural do Rio de Janeiro (UFRRJ)false |
dc.title.por.fl_str_mv |
Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos |
dc.title.alternative.eng.fl_str_mv |
Treatment of large volumes of hydrometeorological data supported by cross-validation in scientific workflows |
title |
Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos |
spellingShingle |
Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos Tomaz, Ulisses Roque Workflow científico validação cruzada proveniência Scientific workflow cross-validation provenance Matemática |
title_short |
Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos |
title_full |
Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos |
title_fullStr |
Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos |
title_full_unstemmed |
Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos |
title_sort |
Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos |
author |
Tomaz, Ulisses Roque |
author_facet |
Tomaz, Ulisses Roque |
author_role |
author |
dc.contributor.author.fl_str_mv |
Tomaz, Ulisses Roque |
dc.contributor.advisor1.fl_str_mv |
Cruz, Sérgio Manuel Serra da |
dc.contributor.advisor1ID.fl_str_mv |
848.488.637-91 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/7618571401128973 |
dc.contributor.advisor-co1.fl_str_mv |
Gregório, Ronaldo Malheiros |
dc.contributor.advisor-co1ID.fl_str_mv |
077.117.167-61 |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/4502104424266743 |
dc.contributor.referee1.fl_str_mv |
Santos, Ednaldo Oliveira dos |
dc.contributor.referee2.fl_str_mv |
Manhães, Laci Mari Barbosa |
dc.contributor.authorID.fl_str_mv |
019.285.167-50 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/3015449888051774 |
contributor_str_mv |
Cruz, Sérgio Manuel Serra da Gregório, Ronaldo Malheiros Santos, Ednaldo Oliveira dos Manhães, Laci Mari Barbosa |
dc.subject.por.fl_str_mv |
Workflow científico validação cruzada proveniência |
topic |
Workflow científico validação cruzada proveniência Scientific workflow cross-validation provenance Matemática |
dc.subject.eng.fl_str_mv |
Scientific workflow cross-validation provenance |
dc.subject.cnpq.fl_str_mv |
Matemática |
description |
Obtergrandes volumes de dados meteorológicos de qualidade e livre de falhas são grandes desafios para estudos climáticos ambientais.O estudo de dados pluviométricos é de grande importância no dia a dia, pois viabiliza o entendimento da variabilidade espacial da precipitação em uma região ou bacia hidrográfica o que possibilita determinar o período e avaliar a probabilidade da ocorrência de eventos extremos, sendo de suma importância para as ações associadas ao planejamento urbano, industrial e agropecuário, além do uso racional dos recursos hídricos.No Brasil, eles são obtidos a partir de estações meteorológicas, geograficamente distribuídasem todo território e fornecidos por vários órgãos, principalmente, peloInstituto Nacional de Meteorologia (INMET)e pela Agência Nacional de Águas (ANA).No entanto, obter dados estruturados curados de qualidade e livre de falhas é um problema que ainda é estudado por diversos autores. Assim, detectar e preencher as falhas encontradas nos dados é um passo importante para o controle de qualidade. Neste sentido, este trabalho estuda e aplica o método de validação cruzada para a seleção dos métodos de interpolação (regressão linear, ponderação regional, inverso do quadrado da distância e ponderação regional com base em regressões lineares) no preenchimento de falhasde longas séries de dados pelo uso em workflows científicos. Para controlar, integrar e produzir essa massa de dados curados, as tarefas de computação se apoiaram na execução de experimentos científicosin silico voltados para a área da Meteorologia baseadas no paradigma dos workflows científicos, que capturaram descritores de proveniência, que auxiliam na rastreabilidade dos dados e processos, e assim, revelam como foram produzidos, e, ainda, asseguram a qualidade da metodologia aplicada. Esta pesquisa propôs, modelou e avaliou umworkflow científico com base em experimentos computacionais capazes de manipular grandes volumes de dados meteorológicos brutos, transformando-os em curados e estabelecendo sua proveniência. Além disso, a proposta consiste em armazená-los na base de dados compatível com o sistema Meteoro desenvolvido previamente pelo nosso grupo de pesquisas.Neste processo foram analisados os dados hidrológicos de 34 estações pluviométricas (séries com no mínimo 10 anos), de 77 inicialmente selecionadas e,dentre os métodos avaliados o que apresentou melhores resultados foi o da ponderação regional (PR). |
publishDate |
2016 |
dc.date.issued.fl_str_mv |
2016-09-19 |
dc.date.accessioned.fl_str_mv |
2023-12-22T02:59:56Z |
dc.date.available.fl_str_mv |
2023-12-22T02:59:56Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
TOMAZ, Ulisses Roque. Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos. 2016. 117 f. Dissertação (Mestrado em Modelagem Matemática e Computacional) - Instituto de Ciências Exatas, Universidade Federal Rural do Rio de Janeiro, Seropédica - RJ, 2016. |
dc.identifier.uri.fl_str_mv |
https://rima.ufrrj.br/jspui/handle/20.500.14407/14321 |
identifier_str_mv |
TOMAZ, Ulisses Roque. Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos. 2016. 117 f. Dissertação (Mestrado em Modelagem Matemática e Computacional) - Instituto de Ciências Exatas, Universidade Federal Rural do Rio de Janeiro, Seropédica - RJ, 2016. |
url |
https://rima.ufrrj.br/jspui/handle/20.500.14407/14321 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.references.por.fl_str_mv |
(COOPERATIVE INFORMATION SYSTEMS). 1. ed. Massachusetts, MIT Press, 2002. ALTINTAS, I.; BERKLEY, C.; JAEGER, E.; JONES, M.; LUDASCHER, B.; MOCK, S.. KEPLER: AN EXTENSIBLE SYSTEM FOR DESIGN AN EXECUTION OF SCIENTIFIC WORKFLOWS.In:Scientific and Statistical Database Management, p. 423-424, Grécia, 2004. AMORIM, R. C. F.; RIBEIRO, A.; LEITE, C. C.; LEAL, B. G.; SILVA, J. B. G.. AVALIAÇÃO DO DESEMPENHO DE DOIS MÉTODOS DE ESPACIALIZAÇÃO DA PRECIPITAÇÃO PLUVIAL PARA O ESTADO DE ALOGOAS. Acta Scientiarum. Technology, v.30, n. 1, p. 87-91, 2008. ANA – AGÊNCIA NACIONAL DE ÁGUAS. EVOLUÇÃO DA REDE HIDROMETEOROLÓGICA NACIONAL. Brasília: ANA, 2007. ANA – AGÊNCIA NACIONAL DE ÁGUAS. INVENTÁRIO DAS ESTAÇÕES PLUVIOMÉTRICAS. Brasília, 2ª ed. ANA; SGH, 2009. ANA – AGÊNCIA NACIONAL DE ÁGUAS. DIRETRIZES E ANÁLISES RECOMENDADAS PARA CONSISTÊNCIA DE DADOS PLUVIOMÉTRICOS. Superintendência de Gestão de Rede Hidrometeorológica. Brasília: ANA, SGH 2011. ANA – AGÊNCIA NACIONAL DE ÁGUAS. CONJUNTURA DOS RECURSOS HÍDRICOS NO BRASIL: REGIÕES HIDROGRÁFICAS BRASILEIRAS. ed. Especial Brasília: ANA, 2015. BARBOSA, S. E. S.; BARBOSA JUNIOR, A. R.; SILVA, G. Q.; CAMPOS, E. N. B.; RODRIGUES, V. C.. GERAÇÃO DE MODELOS DE REGIONALIZAÇÃO DE VAZÕES MÁXIMAS, MÉDIAS DE LONGO PERÍODO E MÍNIMAS DE SETE DIAS PARA A BACIA DO RIO DO CARMO, MINAS GERAIS. Engenharia Sanitária e Ambiental , v. 10, p. 64-71, 2005. BARROS, A. J. P.; LEHFELD, N. A. S..PROJETO DE PESQUISA: PROPOSTAS METODOLÓGICAS. 8.ed. Petrópolis. Vozes, 95 p. 1999. BERTONI, J. C., TUCCI, C. E. M..PRECIPITAÇÃO. In: TUCCI, C. E. M. Hidrologia: Ciência e Aplicação. Porto Alegre, UFRGS. p. 177-241. 2007. CALLAHAN, S. P.; FREIRE. J.; SANTOS, E.; SCHEIDEGGER, C. E.; SILVA, C. T.; VO, H. T..VISTRAILS: VISUALIZATION MEETS DATA MENAGEMENT. In:Proc. SIGMOD 2006, p. 745-747, USA, 2006. CONGIUSTA, A.; GRECO, G.; GUZZO, A.; MANCO, G.; PONTIERI, L.; SACCA, D.; TALIA, D..A DATA MINING-BASED FRAMEWORK FOR GRID WORKFLOW MANAGEMENT, in Proc. 5th International Conference on Quality Software (QSIC '05), p. 349–356, IEEE Computer Society Press, 2005. CRUZ, S. M. S..UMA ESTRATÉGIA DE APOIO À GERÊNCIA DE DADOS DE PROVENIÊNCIA EM EXPERIMENTOS CIENTÍFICOS. Tese de Doutorado. PESC/COPPE-UFRJ. Rio de Janeiro, 2011. DAVIDSON, S. B.; FREIRE, J.. PROVENANCE AND SCIENTIFIC WORKFLOWS: CHALLENGES AND OPPORTUNITIES. In:ACM SIGMOD International Conference on Management of Data, p. 1345-1350, Vancouver, Canada. 2008. DEELMAN, E.; MEHTA, G.; SINGH, G.; SU, M.; VAHI, K.; PEGASUS: MAPPING LARGE-SCALE WORKFLOWS TO DISTRIBUTED RESOURCES. In:Workflows for e-Science,Springer, p. 376-394, 2007. DEELMAN, E.; CHERVENAK, A.. DATA MANAGEMENT CHALLENGES OF DATA-INTENSIVE SCIENTIFIC WORKFLOWS. In: Proc. Of theEighth IEEE International Symposium on Cluster Computing and the Grid,Washington, DC, p. 687-692, 2008. 53 DEELMAN, E.; GANNON, D.; SHIELDS, M.; TAYLOR, I.. WORKFLOWS AND E-SCIENCE: AN OVERVIEW OF WORKFLOW SYSTEM FEATURES AND CAPABILITIES, In: Future Generation Computer Systems, v. 25, n. 5, p. 528-540, 2009. DIERBACH, C.. INTRODUCTION TO COMPUTER SCIENCE USING PYTHON: A COMPUTACIONAL PROBLEM-SOLVING FOCUS. Wiley, USA, 2013. EAGLESON, P. S.. THE EVOLUTION OF MODERN HYDROLOGY (FROM WATERSHED TO CONTINENT IN 30 YEARS), MIT Colloquium on Hydroclimatology and Global Hydrology, In: Advances in Water Resources, v. 17, n. 1, p. 3-18, ISSN 0309-1708, 1994. EISCHEID, J. K.; BAKER, C. B.; KARL, T.; DIAZ, H. F.. THE QUALITY CONTROL OF LONG-TERM CLIMATOLOGICAL DATA USING OBJECTIVE DATA ANALYSIS. In: Journal of Applied Meteorology. v. 34, n. 12, 1995. EFRON, B.. THE JACKNIFE, THE BOOTSTRAP AND OTHER RESAMPLING PLANS. CBMS National Science Monograph 38, Society of Industrial and Applied Mathematics, 1982. FAHRINGER, T., PRODAN, R., DUAN, R., HOFER, J., NADEEM, F., NERIERI, F., PODLIPNIG, S., QIN, J., SIDDIQUI, M., TRUONG, H.-L., VILLAZÓN, A., WIECZOREK, M.. ASKALON: A DEVELOPMENT AND GRID COMPUTING ENVIRONMENT FOR SCIENTIFIC WORKFLOWS. In TAYLOR, I. J., DEELMAN, E., GANNON, D. B., and SHIELDS, M., editors. Workflows for e-Science, chapter 27, p. 450– 471. Springer, 2007. FENG, S.; HU, Q.; QIAN, W.. QUALITY CONTROL OF DAILY METEOROLOGICAL DATA IN CHINA 1951 -2000: A NEW DATASET. In: Internacional Journal of Climatology. v.24, p. 853-870, 2004. FERRARI, A. T.. METODOLOGIA DA PESQUISA CIENTÍFICA. São Paulo, McGraw-Hill, 1982. FERRARI, G. T.. IMPUTAÇÃO DE DADOS PLUVIOMÉTRICOS E SUA APLICAÇÃO NA MODELAGEM DE EVENTOS EXTREMOS DA SECA AGRÍCOLA. Dissertação de Mestrado - USP, Piracicaba, 2011. FREIRE, J.; KOOP, D.; SANTOS, E.; SILVA, C. T.. PROVENANCE FOR COMPUTATIONAL TASKS: A SURVEY, Computing in Science &Engineering,IEEE Educational Activities Department, Piscataway, NJ, USA,v. 10, n. 3, p. 11-21, 2008. FURLAN, D. N.. VARIABILIDADE TEMPORAL E ESPACIAL DA CHUVAS E DO BALANÇO HÍDRICO NO ESTADO DE RONDÔNIA: CARACTERIZAÇÃO E ANÁLISE DE TENDÊNCIA. Dissertação de Mestrado. Escola Superior de Agricultura Luiz de Queiroz, 2009. GARCEZ, L. N.; ALVAREZ, G. A.. HIDROLOGIA.2º Ed. Rev. e Atual. São Paulo: Blucher, 1988. GIL, A. C. MÉTODOS E TÉCNICAS DE PESQUISA SOCIAL. 5. ed. São Paulo: Atlas, 1999. GOBLE, C.. POSITION STATEMENT: MUSINGS ON PROVENANCE, WORKFLOW AND (SEMANTIC WEB). Annotations for Bioinformatics. In: Workshop on Data Derivation and Provenance, Chicago, 2002. GODERIS, A.; SATTLER, U.; LORD, P.; GOBLE, C.. SEVEN BOTTLENECKS TO WORKFLOW REUSE AND REPURPOSING. In:The Semantic Web – ISWC 2005. LNCS 3729, pp 323-337, Springer-Verlag Berlin Heidelberg, 2005. GOECKS, J.; NEKRUTENKO, A.; TAYLOR, J.; GALAXY TEAM, T.. GALAXY: A COMPREHENSIVE APPROACH FOR SUPPORTING ACCESSIBLE, REPRODUCIBLE, AND TRANSPARENT COMPUTATIONAL RESEARCH IN THE LIFE SCIENCES.Genome biology, v. 11, n. 8, p. 1, 2010. 54 GRAY, J. JIM GRAY ON ESCIENCE: A TRANSFORMED SCIENTIFIC METHOD. In: HEY, T.; TANSLEY, S.; TOLLE, K. (Ed.). The Fourth Paradigm: Data-Intensive Scientific Discovery. Washington: Microsoft Research, 2009. GREENWOOD, M.; GOBLE, C.; STEVENS, R.; ZHAO, J.; ADDIS, M.; MARVIN, D.; MOREAU, L.; OINN, T.. PROVENANCE OF E-SCIENCE EXPERIMENTS - EXPERIENCE FROM BIOINFORMATICS. In:Proc.The UK OST e-Science 2nd AHM 2003, Nottingham, UK, p. 223-226, 2003. GURU, S. M.; KEARNEY, M.; FITCH, P.; PETERS, C. CHALLENGES IN USING SCIENTIFIC WORKFLOW TOOLS IN THE HYDROLOGY DOMAIN. 18th World IMACS Congress and MODSIM09, International Congress on Modelling and Simulation. Cairns, Australia, p. 3514-3520, 2009. HOLLINGSWORTH, D.. THE WORKFLOW REFERENCE MODEL. WORKFLOW MANAGEMENT COALITION, Hampshire, UK, 1995. HULL, D.; WOLSTENCROFT, K.; STEVENS, R.; GOBLE, C.; POCOCK, M. R.; LI, P.; OINN, T.. TAVERNA: A TOOL FOR BUILDING AND RUNNING WORKFLOWS OF SERVICES.Nucleic Acids Research, v. 34, n. 2, p. 729-732, 2006. INMET - INSTITUTO NACIONAL DE METEOROLOGIA. NORMAIS CLIMATOLÓGICAS DO BRASIL / 1961-1990. 2013. INMET – INSTITUTO NACIONAL DE METEOROLOGIA., Disponível em: <http://www.inmet.gov.br/portal/index.php?r=home2/index >. Acesso em 14 de julho de 2016. JAGADISH, H. V.; OLKEN, F.. DATABASE MANAGEMENT FOR LIFE SCIENCES RESEARCH. In:ACM SIGMOD Record, New York, USA, v. 33, n. 2, p. 15-20, 2004. KOHAVI, R.. A STUDY OF CROSS-VALIDATION AND BOOTSTRAP FOR ACCURACY ESTIMATION AND MODEL SELECTION. In:Proc. 14th International Joint Conference on Artificial Intelligence – v. 2 (IJCAI'95). Morgan Kaufmann Publishers Inc., San Francisco, CA, USA, p. 1137-1143, 1995. LAKATOS, E. M.; MARCONI, M. A. METODOLOGIA CIENTIFICA. 2a . ed. São Paulo: EditoraAtlas. 242 p. 1991. LEGATES, D. R.; MCCABE JR., G. J. EVALUATING THE USE OF “GOODNESS-OF-FIT” MEASURES IN HYDROLOGIC AND HYDROCLIMATIC MODEL VALIDATION. In: Water Resources Research, v.35, n.1, p.233-241, 1999. LEMOS FILHO, G. R.; PRECINOTO, R. S.; CORREIA, T. P.; SANTOS, E. O.; LYRA, G. B.; CRUZ, S. M. S.. ASSIMILAÇÃO, CONTROLE DE QUALIDADE E ANÁLISE DE DADOS METEOROLÓGICOS APOIADOS POR PROVENIÊNCIA. In: Anais do XXXIII Congresso da Sociedade Brasileira de Computação, 2013 LIM, C.; LU, S.; CHEBOTKO, A.; FOTOUHI, F.. PROSPECTIVE AND RETROSPECTIVE PROVENANCE COLLECTION IN SCIENTIFIC WORKFLOW ENVIRONMENTS. In:Services Computing (SCC), IEEE International Conference on, Miami, FL, p. 449-456, 2010. MAGINA, F. C.. AQUISIÇÃO AUTOMÁTICA E TRATAMENTO DE DADOS METEOROLÓGICOS APLICÁVEIS AO PROJETO E OPERAÇÃO DE LINHAS AÉREAS DE TRANSMISSÃO DE ENERGIA ELÉTRICA. Dissertação (Mestrado), Universidade Federal de Itajubá. 2007. MARINHO, A.; MURTA, L.; WERNER, C.; BRAGANHOLO, V.; CRUZ, S. M. S. da; MATTOSO, M.. A STRATEGY FOR PROVENANCE GATHERING IN DISTRIBUTED SCIENTIFIC WORKFLOWS. In:IEEE International Workshop on Scientific Workflows, p. 344-347, Los Angeles, California, United States. 2009. MARK, L. ASCHER, D. APRENDENDO PYTHON. 2 ed. Porto Alegre: Bookman, 2007. 55 MATTOS, A.; SILVA, F. C.; RUBERG, N.; CRUZ, S. M. S. da.; MATTOSO, M. L. Q.. GERÊNCIA DE WORKFLOWS CIENTÍFICOS: UMA ANÁLISE CRÍTICA NO CONTEXTO DA BIOINFORMÁTICA. Coppe/UFRJ, PESC, Technical Report Es-716/08. 2008. MATTOSO, M.; WERNER, C.; TRAVASSOS, G. H.; BRAGANHOLO, V.; MURTA, L.; OGASAWARA, E.; OLIVEIRA, F.; MARTINHO, W.. DESAFIOS NO APOIO À COMPOSIÇÃO DE EXPERIMENTOS CIENTÍFICOS EM LARGA ESCALA. In:Seminário Integrado de Software e Hardware (XXXVI SEMISH), p. 307-321, 2009. MCKINNEY, W.. PYTHON FOR DATA ANALYSIS. 2 ed. O'Reilly Media, Inc., Sebastopol, CA, USA. 2013. MELLO, C. R.; SILVA, A. M. da..MODELAGEM ESTATÍSTICA DA PRECIPITAÇÃO MENSAL E ANUAL E NO PERÍODO SECO PARA O ESTADO DE MINA GERAIS.Revista brasileira de Engenharia Agrícola e Ambiental, v.13, n.1, p.68-74, 2009. MOREAU, L.; GROTH, P.; MILES, S.; VÁZQUEZ-SALCEDA, J.; IBBOTSON, J.; JIANG, S.; MUNROE, S.; RANA, O.; SCHREIBER, A.; TAN, V.; VARGA, LASZLO.. THE PROVENANCE OF ELECTRONIC DATA. Commun. ACM, New York, v. 51, n. 4, p. 52-58, 2008. NAGHETTINI, M.; PINTO, E. J. A.. HIDROLOGIA ESTATÍSTICA. Belo Horizonte. CPRM, 2007. OINN, T.; LI, P.; KELL, D. B.; GOBLE, C.; GODERIS, A.; GREENWOOD, M.; HULL, D.; STEVENS, R.;TURI, D.; ZHAO, J.. TAVERNA/MYGRID: ALIGNING A WORKFLOW SYSTEM WITH THE LIFE SCIENCES COMMUNITY. In:Workflows for e-Science, Springer, p. 300-319, 2007. OGASAWARA, E. S.. UMA ABORDAGEM ALGÉBRICA PARA WORKFLOWS CIENTÍFICOS COM DADOS EM LARGA ESCALA. Tese de Doutorado. PESC/COPPE-UFRJ. Rio de Janeiro, 2011. OLIVEIRA, L. F. C.; FIOREZE, A. P.; MEDEIROS, A. M. M.; SILVA, M. A. S.. COMPARAÇÃO DE METODOLOGIAS DE PREENCHIMENTO DE FALHAS DE SÉRIES HISTÓRICAS DE PRECIPITAÇÃO PLUVIAL ANUAL.In:XVI Congresso Brasileiro de Agrometeorologia. Belo Horizonte. 2009. OLIVEIRA, D.; OGASAWARA, E.; CHIRIGATI, F.; SOUSA, V.; MURTA, L.; WERNER, C.; MATTOSO, M.. UMA ABORDAGEM SEMÂNTICA PARA LINHAS DE EXPERIMENTOS CIENTÍFICOS USANDO ONTOLOGIAS. In:III e-Science workshop - XXIV SBBD & XXIII SBES, 2009a. PRUSKI, F. F.; PEREIRA, S. B.; NOVAES, L. F.; SILVA, D. D.; RAMOS, M. M. PRECIPITAÇÃO MÉDIA ANUAL E VAZÃO ESPECÍFICA MÉDIA DE LONGA DURAÇÃO, NA BACIA DO SÃO FRANCISCO. Revista Brasileira de Engenharia Agrícola e Ambiental, v.8, n.2/3, p.247-253, 2004. SILVA, C. E. P; OLIVEIRA, D.; CRUZ, S. M. S.; CAMPOS, M. L. M.; MATTOSO, M.. CAPTURA DE METADADOS DE PROVENIÊNCIA PARA WORKFLOWS CIENTÍFICOS EM NUVENS COMPUTACIONAIS. In:Anais do XXV Simpósio Brasileiro de Bancos de Dados, p. 215-223, Belo Horizonte, 2010. SILVA, C. T.; ANDERSON, E.; SANTOS, E.; FREIRE, J.. USING VISTRAILS AND PROVENANCE FOR TEACHING SCIENTIFIC VISUALIZATION. The Eurographics Association, 2010a. SILVA, F. C.. TRATAMENTO E PREENCHIMENTO DE FALHAS DE SÉRIES DE DADOS METEOROLÓGICOS UTILIZANDO WORKFLOWS CIENTÍFICOS PARALELOS EM AMBIENTES DE CPU. Dissertação de Mestrado, UFRRJ/PPGMMC, 2014. SILVA, F. D. S.; RAMOS, R. M.; COSTA, R. L.; AZEVEDO, P. V.. SISTEMA DE CONTROLE DE QUALIDADE PARA DADOS DIÁRIOS DE VARIÁVEIS METEOROLÓGICAS. Revista Brasileira de Geografia Física, vol, 07, n. 05, 2014a. 56 SIMMHAN, Y. L.; PLALE, B.; GANNON, D.. A SURVEY OF DATA PROVENANCE IN e-SCIENCE. ACM SIGMOD, v.34, p. 31-36, New York, USA. 2005. SNEE, R. D.. VALIDATION OF REGRESSION MODELS: METHODS AND EXAMPLES. In:Technometrics, v. 19, n 4. 1977. TAYLOR, I. J.; DEELMAN, E.; GANNON, D. B.; SHIELDS, M.. WORKFLOWS FOR e-SCIENCE: SCIENTIFIC WORKFLOWS FOR GRIDS. 1 ed. Springer. 2007. TAYLOR, I.; SHIELDS, M.; WANG, I.; HARRISON, A.. THE TRIANA WORKFLOW ENVIRONMENT: ARCHITECTURE AND APPLICATIONS.In:Workflows for e-Science, Springer, p. 320-339, 2007a. TRAVASSOS, G. H.; BARROS, M. O. CONTRIBUTIONS OF IN VIRTUO AND IN SILICO EXPERIMENTS FOR THE FUTURE OF EMPIRICAL STUDIES IN SOFTWARE ENGINEERING, In:Proc. of the WSESE03, Fraunhofer IRB Verlag, Roma. 2003. WAGNER, P. D.; FIENER, P.; WILKEN, F.; KUMAR, S.; SCHNEIDER, K.. COMPARISON AND EVALUATION OF SPATIAL INTERPOLATION SCHEMES FOR DAILY RAINFALL IN DATA SCARCE REGIONS. Journal of Hydrology. vol 464-465. p. 388-400, 2012. WISSMANN, J. A.; TAMPELINI, L. G.; FEIL, A. D.; SAMPAIO, S. C.; SUSZEK, M. FERRAMENTA COMPUTACIONAL PARA ANÁLISE DE CONSISTÊNCIA DE DADOS PLUVIOMÉTRICOS. Varia Scientia, p.99-106, 2006. WMO. WORLD METEOROLOGICAL ORGANIZATION. Disponível em <http://www.wmo.int/pages/index_en.html>. Acesso em 19 Jul. 2016. ZHAO, Y.; HATEGAN, M.; CLIFFORD, B.; FOSTER, I.; VON LASZEWSKI, G.; NEFEDOVA, V.; RAICU, I.; STEF-PRAUN, T.; WILDE, M.. SWIFT: FAST, RELIABLE, LOOSELY COUPLED PARALLEL COMPUTATION. In:Proc. of the 3rd IEEE World Congress on Services, p. 199-206, Salt Lake City, USA, 2007. ZUCCHINI, W.. AN INTRODUCTION TO MODEL SELECTION. Journal of Mathematical Psychology, Volume 44, Issue 1, Pages 41-61, ISSN 0022-2496, 2000. |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal Rural do Rio de Janeiro |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Modelagem Matemática e Computacional |
dc.publisher.initials.fl_str_mv |
UFRRJ |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Instituto de Ciências Exatas |
publisher.none.fl_str_mv |
Universidade Federal Rural do Rio de Janeiro |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRRJ instname:Universidade Federal Rural do Rio de Janeiro (UFRRJ) instacron:UFRRJ |
instname_str |
Universidade Federal Rural do Rio de Janeiro (UFRRJ) |
instacron_str |
UFRRJ |
institution |
UFRRJ |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRRJ |
collection |
Biblioteca Digital de Teses e Dissertações da UFRRJ |
bitstream.url.fl_str_mv |
https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14321/1/2016%20-%20Ulisses%20Roque%20Tomaz.pdf.jpg https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14321/2/2016%20-%20Ulisses%20Roque%20Tomaz.pdf.txt https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14321/3/2016%20-%20Ulisses%20Roque%20Tomaz.pdf https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14321/4/license.txt |
bitstream.checksum.fl_str_mv |
c4715912a635b5fbde63d2a9b070733f aae91fe099bebc6bf1b0c58a2e663b1f 1f4def6f15f5b8861307d659a73e7bff 7b5ba3d2445355f386edab96125d42b7 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRRJ - Universidade Federal Rural do Rio de Janeiro (UFRRJ) |
repository.mail.fl_str_mv |
bibliot@ufrrj.br||bibliot@ufrrj.br |
_version_ |
1810108096657227776 |