Boclusterização na análise de dados incertos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/1614062 |
Resumo: | Orientador: Fernando Jose Von Zuben |
id |
UNICAMP-30_3f69ec71671fe0dc2a960ecf952d0889 |
---|---|
oai_identifier_str |
oai::783091 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Boclusterização na análise de dados incertosBiclustering on uncertais data analysisAprendizado de máquinaDados faltantes (Estatística)ClusterMineração de dados (Computação)Algoritmos evolutivosComputer trainingMissing data (Statistics)ClusterData mining (Computer)Evolutionary algorithmsOrientador: Fernando Jose Von ZubenTese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de ComputaçãoResumo: O processo de aquisição de dados está sujeito a muitas fontes de incerteza e inconsistência. Essas incertezas podem fazer com que os dados se tornem ruidosos ou impedir a aquisição dos mesmos, gerando o problema de dados faltantes. A maioria das ferramentas utilizadas para tratar tais problemas age de forma global em relação às informações da base de dados e ignora o efeito que o ruído pode ter na análise desses. Esta tese tem como objetivo explorar as propriedades do processo de biclusterização, que faz uma análise local dos dados, criando múltiplos modelos de imputação de dados que buscam minimizar o erro de predição dos valores faltantes na base de dados. Primeiramente, é proposto um novo algoritmo de biclusterização com um melhor desempenho que outras abordagens utilizadas atualmente, enfatizando a capacidade dos biclusters em gerar modelos com ruído reduzido. Em seguida, é proposta uma formulação de otimização quadrática para, utilizando os modelos locais gerados pelo bicluster, imputar os valores faltantes na base de dados. Os resultados obtidos indicam que a utilização da biclusterização ajuda a reduzir o erro de predição da imputação, além de fornecer condições favoráveis a uma análise a posteriori das informações contidas nos dadosAbstract: The data acquisition process is subject to many inconsistencies and uncertainties. These uncertainties may produce noisy data or even provoke the absence of some of them, thus leading to the missing data problem. Most procedures used to deal with such problem act in a global manner, relatively to the dataset, and ignore the noise e_ect on such analysis. The objective of this thesis is to explore the properties of the so called biclustering method, which performs a local data analysis, creating several imputation models for the dataset in order to minimize the prediction error estimating missing values of the dataset. First, it is proposed a new biclustering algorithm with a better performance than the one produced by other traditional approaches, with emphasis on the noise reduction capability of the models generated by the biclusters. Next, it is proposed the formulation of a quadratic optimization problem to impute the missing data by means of the local models engendered by a set of biclusters. The obtained results show that the use of biclustering helps to reduce the prediction error of data imputation, besides providing some interesting conditions for an a posteriori analysis of the datasetDoutoradoEngenharia de ComputaçãoDoutor em Engenharia Elétrica[s.n.]Von Zuben, Fernando José, 1968-Coelho, André Luís VasconcelosBuarque de Lima Neto, FernandoLyra Filho, ChristianoAttux, Romis Ribeiro de FaissolUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASFrança, Fabrício Olivetti de, 1980-2010info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf172 p. : il.https://hdl.handle.net/20.500.12733/1614062FRANÇA, Fabrício Olivetti de. Boclusterização na análise de dados incertos. 2010. 172 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1614062. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/783091porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T06:08:06Zoai::783091Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T06:08:06Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Boclusterização na análise de dados incertos Biclustering on uncertais data analysis |
title |
Boclusterização na análise de dados incertos |
spellingShingle |
Boclusterização na análise de dados incertos França, Fabrício Olivetti de, 1980- Aprendizado de máquina Dados faltantes (Estatística) Cluster Mineração de dados (Computação) Algoritmos evolutivos Computer training Missing data (Statistics) Cluster Data mining (Computer) Evolutionary algorithms |
title_short |
Boclusterização na análise de dados incertos |
title_full |
Boclusterização na análise de dados incertos |
title_fullStr |
Boclusterização na análise de dados incertos |
title_full_unstemmed |
Boclusterização na análise de dados incertos |
title_sort |
Boclusterização na análise de dados incertos |
author |
França, Fabrício Olivetti de, 1980- |
author_facet |
França, Fabrício Olivetti de, 1980- |
author_role |
author |
dc.contributor.none.fl_str_mv |
Von Zuben, Fernando José, 1968- Coelho, André Luís Vasconcelos Buarque de Lima Neto, Fernando Lyra Filho, Christiano Attux, Romis Ribeiro de Faissol Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação Programa de Pós-Graduação em Engenharia Elétrica UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
França, Fabrício Olivetti de, 1980- |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Dados faltantes (Estatística) Cluster Mineração de dados (Computação) Algoritmos evolutivos Computer training Missing data (Statistics) Cluster Data mining (Computer) Evolutionary algorithms |
topic |
Aprendizado de máquina Dados faltantes (Estatística) Cluster Mineração de dados (Computação) Algoritmos evolutivos Computer training Missing data (Statistics) Cluster Data mining (Computer) Evolutionary algorithms |
description |
Orientador: Fernando Jose Von Zuben |
publishDate |
2010 |
dc.date.none.fl_str_mv |
2010 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/1614062 FRANÇA, Fabrício Olivetti de. Boclusterização na análise de dados incertos. 2010. 172 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1614062. Acesso em: 3 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1614062 |
identifier_str_mv |
FRANÇA, Fabrício Olivetti de. Boclusterização na análise de dados incertos. 2010. 172 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1614062. Acesso em: 3 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/783091 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 172 p. : il. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189045803155456 |