Técnicas de agrupamento e de hierarquização no contexto de KDD - aplicação a dados temporais de instrumentação geotécnica-estrutural da usina hidrelétrica de Itaipu.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2009 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPR |
Texto Completo: | https://hdl.handle.net/1884/20898 |
Resumo: | Orientador: Profª. Dra. Maria Teresinha Arns Steiner |
id |
UFPR_e5ad00292ba1fa2767847ae5d7a4fe39 |
---|---|
oai_identifier_str |
oai:acervodigital.ufpr.br:1884/20898 |
network_acronym_str |
UFPR |
network_name_str |
Repositório Institucional da UFPR |
repository_id_str |
308 |
spelling |
Dyminski, Andrea SellSiqueira, Paulo Henrique, 1976-Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em EngenhariaSteiner, Maria Teresinha Arns, 1957-Villwock, Rosangela2024-05-20T18:24:37Z2024-05-20T18:24:37Z2009https://hdl.handle.net/1884/20898Orientador: Profª. Dra. Maria Teresinha Arns SteinerCoorientadores: Profª. Dra. Andréa Sell Dyminski e Prof. Dr. Paulo Henrique SiqueiraTese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Exatas e Setor de Tecnologia, Programa de Pós-Graduação em Métodos Numéricos em Engenharia. Defesa: Curitiba, 29/07/2009Inclui bibliografiaÁrea de concentração: Programação matemáticaResumo: O monitoramento da estrutura de uma barragem, de importância bem conhecida, pode gerar uma enorme massa de dados, definidos em domínios multidimensionais,cuja análise e interpretação nem sempre são triviais. É importante selecionar asinformações que melhor "expliquem" o comportamento da barragem, permitindo a previsão e a resolução de eventuais problemas que possam ocorrer. A Usina Hidrelétrica de Itaipu, maior geradora de hidroeletricidade do mundo, possui mais de2.200 instrumentos que monitoram seu comportamento geotécnico e estrutural, os quais possuem leituras armazenadas em um banco de dados há mais de 30 anos.Assim sendo, o objetivo principal deste trabalho é apresentar uma metodologia,enquadrada na área de KDD, "Descoberta de Conhecimento em Bases de Dados", com o intuito de realizar a hierarquização de instrumentos de monitoramento de barragens, maximizando a eficácia e eficiência das análises das leituras, através da identificação de grupos de instrumentos semelhantes e, também, detectando osprincipais instrumentos. A metodologia foi aplicada à 30 extensômetros localizados em diferentes blocos do trecho F da referida barragem que, com uma, duas ou três hastes, totalizam 72 medidas de deslocamentos, das quais 24 foram automatizadaspela empresa. Para a fase de pré-processamento dos dados, do processo KDD, identificou-se que para a maioria dos instrumentos tem-se uma leitura mensal, porém, alguns deles, apresentam mais de uma leitura por mês sendo que, nestes casos, foi obtida a média mensal. Por outro lado, alguns instrumentos apresentaram leituras faltantes e, nestas situações, foram realizadas interpolações por sériestemporais garantindo, desta forma, que todos os instrumentos tivessem exatamente 120 leituras (10 anos). Já para a fase de Mineração de Dados, do processo KDD, a tarefa é o agrupamento de padrões e, para isso, foram utilizados os seguintesmétodos: da área de Análise Estatística Multivariada (Ligação Simples, Média, Completa e Método Ward); da área de Redes Neurais Artificiais (Redes Neurais de Kohonen) e da área de Metaheurísticas (foi proposto um Algoritmo de Agrupamento Baseado em Formigas). Em relação ao algoritmo proposto, este foi testado em trêsbases de dados reais (IRIS, WINE e PIMA Indians Diabetes) e em duas bases de dados reais de séries temporais (GUN e LIGHTNING-2), sendo que o seu desempenho foi comparado com o de outros dois métodos (Método Ward e RedesNeurais de Kohonen). Na aplicação da Análise de Agrupamento (pelo Método Ward) aos dados de instrumentação geotécnica-estrutural da Itaipu, mostrou-se que é possível encontrar justificativas técnicas para a formação dos grupos, inclusive identificando um grupo de hastes de maior importância. Já a aplicação da Análise Fatorial aos referidos dados, mostrou-se bastante eficaz para realizar a hierarquização das hastes de extensômetros, com base nas comunalidades. No algoritmo proposto, as principais modificações em relação ao algoritmo básico proposto por Deneubourg et al. (1991, apud Handl, Knowles e Dorigo, 2006), foram: a introdução de uma comparação da probabilidade de descarregar um padrão na posição escolhida aleatoriamente com a probabilidade de descarregar este padrão em sua posição atual; a introdução de uma avaliação da probabilidade de uma posição vizinha, quando a decisão de descarregar um padrão for positiva e a célula em que o padrão deveria ser descarregado estiver ocupada; e a substituição do padrão carregado por uma formiga, caso este padrão não seja descarregado em 100 iterações consecutivas. O algoritmo proposto apresentou resultados satisfatórios em relação aos resultados de Boryczka (2008) para as bases de dados reais e, quando aplicado aos dados de instrumentação geotécnica-estrutural da Itaipu, o mesmo foi capaz de identificar o grupo de hastes de maior importância.Abstract: The monitoring of the dam structures, of known importance, can generate an enormous mass of data, defined in multidimensional domains, which analysis and interpretation are not trivial. It is important to select the information that best"explains" the behavior of the dam, allowing the forecast and the resolution of eventual problems that can happen. The Hydroelectric Power Plant of Itaipu, the largest hydro electrical power producer of the world, has more than 2.200 instruments to monitor its geotechnical and structural behavior, which has readings stored in a database for more than 30 years. In this way, the main goal of this work isto present a methodology, framed in the KDD area, "Knowledge Discovery in Databases", in order to carry out the ranking of instruments of monitoring of dams, maximizing the effectiveness and the efficiency of the readings analyses, through the identification of groups of similar instruments and, also, detecting the main instruments. The methodology was applied to 30 extensometers located in different blocks of the sector F of the referred dam which, with one, two or three rod, totalized 72 measures of displacements, of which 24 were automated by the company. For the phase of preprocessing of the data, of the KDD process, it was identified that the majority of the instruments had a monthly reading, however, some of them, presented more than a reading by month and, in these cases, it was obtained the monthly average. In the other hand, some instruments presented failed readings and,in these situations, interpolations were carried out by time series assuring, in this way, that all of the instruments had exactly 120 readings (10 years). In the Data Mining phase, of the process KDD, the task is to group the patterns and, for that, the following methods were used: of the Multivariate Statistical Analysis area (Single Linkage, Average Linkage, Complete Linkage and Ward Method); of the Artificial Neural Networks area (Kohonen Maps) and of the Metaheuristics area (it wasproposed an Ant Based Clustering Algorithm). In relation to the proposed algorithm, it was tested in three real databases (IRIS, WINE and PIMA Indians Diabetes) and in two time series real databases (GUN and LIGHTNING-2), and their performanceswere compared with other two methods (Ward Method and Kohonen Maps). In the application of the Clustering Analysis (by Method Ward) at the data ofinstrumentation geotechnical and structural of the Itaipu, it was shown that it is possible to find technical justification for the formation of the groups and, also,identifying a group of rods of greatest importance. The application of the FactorialAnalysis to the referred data showed to be effective to realize the extensometer rods ranking, based in the communality. In the proposed algorithm, the main modifications in relation to the basic algorithm proposed by Deneubourg et al. (1991, apud Handl,Knowles e Dorigo, 2006), were: the introduction of a comparison of the probability of drop a pattern in a random chosen position with the probability of drop this pattern in the current position; the introduction of a evaluation of the probability of a neighboring position, when the decision of dropping a pattern is positive and the cell in which the pattern should be dropped is busied; and the replacement of the carried pattern by an ant, in case this pattern is not dropped in 100 consecutive iterations. The proposed algorithm presented satisfactory results compared with Boryczka (2008)’s results for the real databases and, when applied to the data of instrumentation geotechnical and structural of the Itaipu, the same was able to identify the group of rods of greatest importance.124f. : il., grafs., tabs.application/pdfDisponível em formato digitalRedes neurais (Computação)Análise multivariadaBarragens e açudes - Medidas de segurançaUsinas hidrelétricasAnálise numéricaTécnicas de agrupamento e de hierarquização no contexto de KDD - aplicação a dados temporais de instrumentação geotécnica-estrutural da usina hidrelétrica de Itaipu.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALTese_R_Villwock.pdfapplication/pdf2037439https://acervodigital.ufpr.br/bitstream/1884/20898/1/Tese_R_Villwock.pdfa491742ea1b5e9c15eac30c55d120cb4MD51open accessTEXTTese_R_Villwock.pdf.txtExtracted Texttext/plain230776https://acervodigital.ufpr.br/bitstream/1884/20898/2/Tese_R_Villwock.pdf.txt185dc1a639a1c6c812a64404a13c2c55MD52open accessTHUMBNAILTese_R_Villwock.pdf.jpgGenerated Thumbnailimage/jpeg1297https://acervodigital.ufpr.br/bitstream/1884/20898/3/Tese_R_Villwock.pdf.jpgdb63cc7e21d79850bde499986dbf5ff1MD53open access1884/208982024-05-20 15:24:37.19open accessoai:acervodigital.ufpr.br:1884/20898Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082024-05-20T18:24:37Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false |
dc.title.pt_BR.fl_str_mv |
Técnicas de agrupamento e de hierarquização no contexto de KDD - aplicação a dados temporais de instrumentação geotécnica-estrutural da usina hidrelétrica de Itaipu. |
title |
Técnicas de agrupamento e de hierarquização no contexto de KDD - aplicação a dados temporais de instrumentação geotécnica-estrutural da usina hidrelétrica de Itaipu. |
spellingShingle |
Técnicas de agrupamento e de hierarquização no contexto de KDD - aplicação a dados temporais de instrumentação geotécnica-estrutural da usina hidrelétrica de Itaipu. Villwock, Rosangela Redes neurais (Computação) Análise multivariada Barragens e açudes - Medidas de segurança Usinas hidrelétricas Análise numérica |
title_short |
Técnicas de agrupamento e de hierarquização no contexto de KDD - aplicação a dados temporais de instrumentação geotécnica-estrutural da usina hidrelétrica de Itaipu. |
title_full |
Técnicas de agrupamento e de hierarquização no contexto de KDD - aplicação a dados temporais de instrumentação geotécnica-estrutural da usina hidrelétrica de Itaipu. |
title_fullStr |
Técnicas de agrupamento e de hierarquização no contexto de KDD - aplicação a dados temporais de instrumentação geotécnica-estrutural da usina hidrelétrica de Itaipu. |
title_full_unstemmed |
Técnicas de agrupamento e de hierarquização no contexto de KDD - aplicação a dados temporais de instrumentação geotécnica-estrutural da usina hidrelétrica de Itaipu. |
title_sort |
Técnicas de agrupamento e de hierarquização no contexto de KDD - aplicação a dados temporais de instrumentação geotécnica-estrutural da usina hidrelétrica de Itaipu. |
author |
Villwock, Rosangela |
author_facet |
Villwock, Rosangela |
author_role |
author |
dc.contributor.other.pt_BR.fl_str_mv |
Dyminski, Andrea Sell Siqueira, Paulo Henrique, 1976- Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em Engenharia |
dc.contributor.advisor1.fl_str_mv |
Steiner, Maria Teresinha Arns, 1957- |
dc.contributor.author.fl_str_mv |
Villwock, Rosangela |
contributor_str_mv |
Steiner, Maria Teresinha Arns, 1957- |
dc.subject.por.fl_str_mv |
Redes neurais (Computação) Análise multivariada Barragens e açudes - Medidas de segurança Usinas hidrelétricas Análise numérica |
topic |
Redes neurais (Computação) Análise multivariada Barragens e açudes - Medidas de segurança Usinas hidrelétricas Análise numérica |
description |
Orientador: Profª. Dra. Maria Teresinha Arns Steiner |
publishDate |
2009 |
dc.date.issued.fl_str_mv |
2009 |
dc.date.accessioned.fl_str_mv |
2024-05-20T18:24:37Z |
dc.date.available.fl_str_mv |
2024-05-20T18:24:37Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1884/20898 |
url |
https://hdl.handle.net/1884/20898 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.pt_BR.fl_str_mv |
Disponível em formato digital |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
124f. : il., grafs., tabs. application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR |
instname_str |
Universidade Federal do Paraná (UFPR) |
instacron_str |
UFPR |
institution |
UFPR |
reponame_str |
Repositório Institucional da UFPR |
collection |
Repositório Institucional da UFPR |
bitstream.url.fl_str_mv |
https://acervodigital.ufpr.br/bitstream/1884/20898/1/Tese_R_Villwock.pdf https://acervodigital.ufpr.br/bitstream/1884/20898/2/Tese_R_Villwock.pdf.txt https://acervodigital.ufpr.br/bitstream/1884/20898/3/Tese_R_Villwock.pdf.jpg |
bitstream.checksum.fl_str_mv |
a491742ea1b5e9c15eac30c55d120cb4 185dc1a639a1c6c812a64404a13c2c55 db63cc7e21d79850bde499986dbf5ff1 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1813898815840714752 |