Um modelo de agrupamento multi-view com ponderação simultânea de tabelas e variáveis

Detalhes bibliográficos
Autor(a) principal: ARAÚJO, Rodrigo Cavalcanti de
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
Texto Completo: https://repositorio.ufpe.br/handle/123456789/30973
Resumo: Modelos de agrupamento multi-view podem ser vistos como uma maneira de extrair informações de diferentes perspectivas dos dados para melhorar a precisão do particionamento resultante. No agrupamento de dados muti-view, é comum existir tabelas irrelevantes e, entre as relevantes, algumas podem ser mais ou menos importantes para contribuir na definição do particionamento final. Por esse motivo, a maior parte dos algoritmos existentes que trabalham com esse tipo de dado atribuem um peso a cada tabela com o objetivo de calcular as relevâncias destas visões no processo de agrupamento. No entanto, poucos algoritmos calculam, além do peso de relevância das visões, os pesos de relevância das variáveis dentro de cada visão com o objetivo de obter, também, a seleção automatizada desses atributos. Este trabalho propõe um algoritmo de agrupamento exclusivo do tipo c-means para dados muti-view que cálcula, de forma automática e simultânea, os pesos para tabelas e variáveis, de modo que as informações relevantes sejam selecionadas para definição da partição. Em comparação com trabalhos similares anteriores, uma vantagem do método proposto é que, além da necessidade de conhecer previamente o número de clusters, não há parâmetros adicionais que precisem ser ajustados. Para validação dos resultados, experimentos com conjuntos de dados de benchmark demonstram a utilidade do método proposto.
id UFPE_a1a1ff52560e587f93149aea4c038718
oai_identifier_str oai:repositorio.ufpe.br:123456789/30973
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling ARAÚJO, Rodrigo Cavalcanti dehttp://lattes.cnpq.br/2085355763842691http://lattes.cnpq.br/3909162572623711CARVALHO, Francisco de Assis Tenório de2019-06-07T21:22:26Z2019-06-07T21:22:26Z2018-06-01https://repositorio.ufpe.br/handle/123456789/30973Modelos de agrupamento multi-view podem ser vistos como uma maneira de extrair informações de diferentes perspectivas dos dados para melhorar a precisão do particionamento resultante. No agrupamento de dados muti-view, é comum existir tabelas irrelevantes e, entre as relevantes, algumas podem ser mais ou menos importantes para contribuir na definição do particionamento final. Por esse motivo, a maior parte dos algoritmos existentes que trabalham com esse tipo de dado atribuem um peso a cada tabela com o objetivo de calcular as relevâncias destas visões no processo de agrupamento. No entanto, poucos algoritmos calculam, além do peso de relevância das visões, os pesos de relevância das variáveis dentro de cada visão com o objetivo de obter, também, a seleção automatizada desses atributos. Este trabalho propõe um algoritmo de agrupamento exclusivo do tipo c-means para dados muti-view que cálcula, de forma automática e simultânea, os pesos para tabelas e variáveis, de modo que as informações relevantes sejam selecionadas para definição da partição. Em comparação com trabalhos similares anteriores, uma vantagem do método proposto é que, além da necessidade de conhecer previamente o número de clusters, não há parâmetros adicionais que precisem ser ajustados. Para validação dos resultados, experimentos com conjuntos de dados de benchmark demonstram a utilidade do método proposto.Multi-View Clustering models can be viewed as a way to extract information from different data representations to improve the clustering accuracy. In multi-view clustering, it is common to exist some irrelevant views and among the relevant ones, some may be more or less relevant than others to contribute in the final partition. This is why the most part of existing multi-view algorithms assign a weight to each view aiming to compute its relevance in the clustering process. However very few algorithms computes also the relevance weight of variables inside each view aiming to achieve automated feature selection. This work proposes a muti-view hard c-means clustering algorithm with automated computation of weights for both views and variables in such a way that the relevant views as well as the relevant variables in each view are selected for clustering. Compared to previous similar works, an advantage of the proposed method is that, apart the need to know previously the number of clusters, there are no additional parameters to tune. Experiments with benchmark data sets corroborate the usefulness of the proposed method.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência computacionalAgrupamento de dadosUm modelo de agrupamento multi-view com ponderação simultânea de tabelas e variáveisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDISSERTAÇÃO Rodrigo Cavalcanti de Araújo.pdf.jpgDISSERTAÇÃO Rodrigo Cavalcanti de Araújo.pdf.jpgGenerated Thumbnailimage/jpeg1365https://repositorio.ufpe.br/bitstream/123456789/30973/5/DISSERTA%c3%87%c3%83O%20Rodrigo%20Cavalcanti%20de%20Ara%c3%bajo.pdf.jpg7ba6aa33dcc7c4e19d3d96d27ed66e0fMD55ORIGINALDISSERTAÇÃO Rodrigo Cavalcanti de Araújo.pdfDISSERTAÇÃO Rodrigo Cavalcanti de Araújo.pdfapplication/pdf2251597https://repositorio.ufpe.br/bitstream/123456789/30973/1/DISSERTA%c3%87%c3%83O%20Rodrigo%20Cavalcanti%20de%20Ara%c3%bajo.pdfb0070e326583839b0609c1654961441bMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/30973/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/30973/3/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD53TEXTDISSERTAÇÃO Rodrigo Cavalcanti de Araújo.pdf.txtDISSERTAÇÃO Rodrigo Cavalcanti de Araújo.pdf.txtExtracted texttext/plain164027https://repositorio.ufpe.br/bitstream/123456789/30973/4/DISSERTA%c3%87%c3%83O%20Rodrigo%20Cavalcanti%20de%20Ara%c3%bajo.pdf.txt179916e231ea5e0f5333f469b11dcd84MD54123456789/309732019-10-25 07:56:36.259oai:repositorio.ufpe.br:123456789/30973TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T10:56:36Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Um modelo de agrupamento multi-view com ponderação simultânea de tabelas e variáveis
title Um modelo de agrupamento multi-view com ponderação simultânea de tabelas e variáveis
spellingShingle Um modelo de agrupamento multi-view com ponderação simultânea de tabelas e variáveis
ARAÚJO, Rodrigo Cavalcanti de
Inteligência computacional
Agrupamento de dados
title_short Um modelo de agrupamento multi-view com ponderação simultânea de tabelas e variáveis
title_full Um modelo de agrupamento multi-view com ponderação simultânea de tabelas e variáveis
title_fullStr Um modelo de agrupamento multi-view com ponderação simultânea de tabelas e variáveis
title_full_unstemmed Um modelo de agrupamento multi-view com ponderação simultânea de tabelas e variáveis
title_sort Um modelo de agrupamento multi-view com ponderação simultânea de tabelas e variáveis
author ARAÚJO, Rodrigo Cavalcanti de
author_facet ARAÚJO, Rodrigo Cavalcanti de
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/2085355763842691
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3909162572623711
dc.contributor.author.fl_str_mv ARAÚJO, Rodrigo Cavalcanti de
dc.contributor.advisor1.fl_str_mv CARVALHO, Francisco de Assis Tenório de
contributor_str_mv CARVALHO, Francisco de Assis Tenório de
dc.subject.por.fl_str_mv Inteligência computacional
Agrupamento de dados
topic Inteligência computacional
Agrupamento de dados
description Modelos de agrupamento multi-view podem ser vistos como uma maneira de extrair informações de diferentes perspectivas dos dados para melhorar a precisão do particionamento resultante. No agrupamento de dados muti-view, é comum existir tabelas irrelevantes e, entre as relevantes, algumas podem ser mais ou menos importantes para contribuir na definição do particionamento final. Por esse motivo, a maior parte dos algoritmos existentes que trabalham com esse tipo de dado atribuem um peso a cada tabela com o objetivo de calcular as relevâncias destas visões no processo de agrupamento. No entanto, poucos algoritmos calculam, além do peso de relevância das visões, os pesos de relevância das variáveis dentro de cada visão com o objetivo de obter, também, a seleção automatizada desses atributos. Este trabalho propõe um algoritmo de agrupamento exclusivo do tipo c-means para dados muti-view que cálcula, de forma automática e simultânea, os pesos para tabelas e variáveis, de modo que as informações relevantes sejam selecionadas para definição da partição. Em comparação com trabalhos similares anteriores, uma vantagem do método proposto é que, além da necessidade de conhecer previamente o número de clusters, não há parâmetros adicionais que precisem ser ajustados. Para validação dos resultados, experimentos com conjuntos de dados de benchmark demonstram a utilidade do método proposto.
publishDate 2018
dc.date.issued.fl_str_mv 2018-06-01
dc.date.accessioned.fl_str_mv 2019-06-07T21:22:26Z
dc.date.available.fl_str_mv 2019-06-07T21:22:26Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/30973
url https://repositorio.ufpe.br/handle/123456789/30973
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/30973/5/DISSERTA%c3%87%c3%83O%20Rodrigo%20Cavalcanti%20de%20Ara%c3%bajo.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/30973/1/DISSERTA%c3%87%c3%83O%20Rodrigo%20Cavalcanti%20de%20Ara%c3%bajo.pdf
https://repositorio.ufpe.br/bitstream/123456789/30973/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/30973/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/30973/4/DISSERTA%c3%87%c3%83O%20Rodrigo%20Cavalcanti%20de%20Ara%c3%bajo.pdf.txt
bitstream.checksum.fl_str_mv 7ba6aa33dcc7c4e19d3d96d27ed66e0f
b0070e326583839b0609c1654961441b
e39d27027a6cc9cb039ad269a5db8e34
4b8a02c7f2818eaf00dcf2260dd5eb08
179916e231ea5e0f5333f469b11dcd84
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1802310736547938304