Boclusterização na análise de dados incertos

Detalhes bibliográficos
Autor(a) principal: França, Fabrício Olivetti de, 1980-
Data de Publicação: 2010
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1614062
Resumo: Orientador: Fernando Jose Von Zuben
id UNICAMP-30_3f69ec71671fe0dc2a960ecf952d0889
oai_identifier_str oai::783091
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Boclusterização na análise de dados incertosBiclustering on uncertais data analysisAprendizado de máquinaDados faltantes (Estatística)ClusterMineração de dados (Computação)Algoritmos evolutivosComputer trainingMissing data (Statistics)ClusterData mining (Computer)Evolutionary algorithmsOrientador: Fernando Jose Von ZubenTese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de ComputaçãoResumo: O processo de aquisição de dados está sujeito a muitas fontes de incerteza e inconsistência. Essas incertezas podem fazer com que os dados se tornem ruidosos ou impedir a aquisição dos mesmos, gerando o problema de dados faltantes. A maioria das ferramentas utilizadas para tratar tais problemas age de forma global em relação às informações da base de dados e ignora o efeito que o ruído pode ter na análise desses. Esta tese tem como objetivo explorar as propriedades do processo de biclusterização, que faz uma análise local dos dados, criando múltiplos modelos de imputação de dados que buscam minimizar o erro de predição dos valores faltantes na base de dados. Primeiramente, é proposto um novo algoritmo de biclusterização com um melhor desempenho que outras abordagens utilizadas atualmente, enfatizando a capacidade dos biclusters em gerar modelos com ruído reduzido. Em seguida, é proposta uma formulação de otimização quadrática para, utilizando os modelos locais gerados pelo bicluster, imputar os valores faltantes na base de dados. Os resultados obtidos indicam que a utilização da biclusterização ajuda a reduzir o erro de predição da imputação, além de fornecer condições favoráveis a uma análise a posteriori das informações contidas nos dadosAbstract: The data acquisition process is subject to many inconsistencies and uncertainties. These uncertainties may produce noisy data or even provoke the absence of some of them, thus leading to the missing data problem. Most procedures used to deal with such problem act in a global manner, relatively to the dataset, and ignore the noise e_ect on such analysis. The objective of this thesis is to explore the properties of the so called biclustering method, which performs a local data analysis, creating several imputation models for the dataset in order to minimize the prediction error estimating missing values of the dataset. First, it is proposed a new biclustering algorithm with a better performance than the one produced by other traditional approaches, with emphasis on the noise reduction capability of the models generated by the biclusters. Next, it is proposed the formulation of a quadratic optimization problem to impute the missing data by means of the local models engendered by a set of biclusters. The obtained results show that the use of biclustering helps to reduce the prediction error of data imputation, besides providing some interesting conditions for an a posteriori analysis of the datasetDoutoradoEngenharia de ComputaçãoDoutor em Engenharia Elétrica[s.n.]Von Zuben, Fernando José, 1968-Coelho, André Luís VasconcelosBuarque de Lima Neto, FernandoLyra Filho, ChristianoAttux, Romis Ribeiro de FaissolUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASFrança, Fabrício Olivetti de, 1980-2010info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf172 p. : il.https://hdl.handle.net/20.500.12733/1614062FRANÇA, Fabrício Olivetti de. Boclusterização na análise de dados incertos. 2010. 172 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1614062. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/783091porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T06:08:06Zoai::783091Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T06:08:06Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Boclusterização na análise de dados incertos
Biclustering on uncertais data analysis
title Boclusterização na análise de dados incertos
spellingShingle Boclusterização na análise de dados incertos
França, Fabrício Olivetti de, 1980-
Aprendizado de máquina
Dados faltantes (Estatística)
Cluster
Mineração de dados (Computação)
Algoritmos evolutivos
Computer training
Missing data (Statistics)
Cluster
Data mining (Computer)
Evolutionary algorithms
title_short Boclusterização na análise de dados incertos
title_full Boclusterização na análise de dados incertos
title_fullStr Boclusterização na análise de dados incertos
title_full_unstemmed Boclusterização na análise de dados incertos
title_sort Boclusterização na análise de dados incertos
author França, Fabrício Olivetti de, 1980-
author_facet França, Fabrício Olivetti de, 1980-
author_role author
dc.contributor.none.fl_str_mv Von Zuben, Fernando José, 1968-
Coelho, André Luís Vasconcelos
Buarque de Lima Neto, Fernando
Lyra Filho, Christiano
Attux, Romis Ribeiro de Faissol
Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação
Programa de Pós-Graduação em Engenharia Elétrica
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv França, Fabrício Olivetti de, 1980-
dc.subject.por.fl_str_mv Aprendizado de máquina
Dados faltantes (Estatística)
Cluster
Mineração de dados (Computação)
Algoritmos evolutivos
Computer training
Missing data (Statistics)
Cluster
Data mining (Computer)
Evolutionary algorithms
topic Aprendizado de máquina
Dados faltantes (Estatística)
Cluster
Mineração de dados (Computação)
Algoritmos evolutivos
Computer training
Missing data (Statistics)
Cluster
Data mining (Computer)
Evolutionary algorithms
description Orientador: Fernando Jose Von Zuben
publishDate 2010
dc.date.none.fl_str_mv 2010
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1614062
FRANÇA, Fabrício Olivetti de. Boclusterização na análise de dados incertos. 2010. 172 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1614062. Acesso em: 3 set. 2024.
url https://hdl.handle.net/20.500.12733/1614062
identifier_str_mv FRANÇA, Fabrício Olivetti de. Boclusterização na análise de dados incertos. 2010. 172 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1614062. Acesso em: 3 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/783091
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
172 p. : il.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809189045803155456