Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões

Detalhes bibliográficos
Autor(a) principal: SIMÕES, Eduardo Cintra
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
Texto Completo: https://repositorio.ufpe.br/handle/123456789/36683
Resumo: Quando se deseja separar um conjunto de elementos sem um conhecimento prévio das suas classes, é necessário utilizar métodos de classificação não-supervisionada, que separam os elementos pelas suas similaridades, mantendo elementos muito distintos em grupos (clusters) diferentes. Contudo, obter um conjunto de características para os elementos pode ser mais custoso do que obter dados relacionais, como a similaridade entre os elementos. Muitas vezes é possível comparar os elementos com diferentes critérios (visões), o que oferece mais informações para distinguir os elementos, permitindo a geração de matrizes de dissimilaridade distintas. Contudo, nem sempre as visões são relevantes para a solução, por causa disso, vários modelos propostos ponderam as diferentes visões, reduzindo a influência daquelas irrelevantes. Em muitas situações, existem elementos com características de várias classes, de forma que classificar um elemento numa única classe não o representa bem. Para melhor representar os elementos nesse tipo de situação, foram desenvolvidos métodos de classificação difusa, que definem graus de pertinência dos elementos para cada classe (em oposição a classificação crisp, que mapeia cada elemento para apenas 1 classe). Os métodos de classificação, assim como vários outros métodos de inteligência artificial, precisam ser configurados para obter resultados melhores, utilizando um conjunto de parâmetros para isso. Contudo, quanto mais parâmetros um método possui, mais custoso se torna a busca por bons parâmetros. Dessa forma, reduzir o número de parâmetros sem afetar os resultados é uma excelente melhoria para um método. Esta dissertação tem como objetivo apresentar um modelo de classificação difusa não-supervisionada para dados relacionais com múltiplas visões. Sendo uma variação do modelo FW4M com um parâmetro a menos, mas com resultados similares ou melhores. O método proposto será comparado com o modelo FW4M e outros dois modelos com propósitos similares ( e MFCMdd-RWG-P) sobre um conjunto de bases de dados, utilizando métricas relevantes para comparar as classificações considerando tanto a partição difusa quanto a crisp.
id UFPE_42e8e35be6af9a055425a6a722d75b18
oai_identifier_str oai:repositorio.ufpe.br:123456789/36683
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling SIMÕES, Eduardo Cintrahttp://lattes.cnpq.br/0683753132362016http://lattes.cnpq.br/3909162572623711CARVALHO, Francisco de Assis Tenório de2020-02-28T18:13:54Z2020-02-28T18:13:54Z2019-12-17SIMÕES, Eduardo Cintra. Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões. 2019. Dissertação (Mestrado em Ciências da Computação) – Universidade Federal de Pernambuco., Recife, 2019.https://repositorio.ufpe.br/handle/123456789/36683Quando se deseja separar um conjunto de elementos sem um conhecimento prévio das suas classes, é necessário utilizar métodos de classificação não-supervisionada, que separam os elementos pelas suas similaridades, mantendo elementos muito distintos em grupos (clusters) diferentes. Contudo, obter um conjunto de características para os elementos pode ser mais custoso do que obter dados relacionais, como a similaridade entre os elementos. Muitas vezes é possível comparar os elementos com diferentes critérios (visões), o que oferece mais informações para distinguir os elementos, permitindo a geração de matrizes de dissimilaridade distintas. Contudo, nem sempre as visões são relevantes para a solução, por causa disso, vários modelos propostos ponderam as diferentes visões, reduzindo a influência daquelas irrelevantes. Em muitas situações, existem elementos com características de várias classes, de forma que classificar um elemento numa única classe não o representa bem. Para melhor representar os elementos nesse tipo de situação, foram desenvolvidos métodos de classificação difusa, que definem graus de pertinência dos elementos para cada classe (em oposição a classificação crisp, que mapeia cada elemento para apenas 1 classe). Os métodos de classificação, assim como vários outros métodos de inteligência artificial, precisam ser configurados para obter resultados melhores, utilizando um conjunto de parâmetros para isso. Contudo, quanto mais parâmetros um método possui, mais custoso se torna a busca por bons parâmetros. Dessa forma, reduzir o número de parâmetros sem afetar os resultados é uma excelente melhoria para um método. Esta dissertação tem como objetivo apresentar um modelo de classificação difusa não-supervisionada para dados relacionais com múltiplas visões. Sendo uma variação do modelo FW4M com um parâmetro a menos, mas com resultados similares ou melhores. O método proposto será comparado com o modelo FW4M e outros dois modelos com propósitos similares ( e MFCMdd-RWG-P) sobre um conjunto de bases de dados, utilizando métricas relevantes para comparar as classificações considerando tanto a partição difusa quanto a crisp.When one wants cluster objects without a previous knowledgement of its classes, it’s necessary to utilize non-supervised classification methods, which separate the elements based on their similarities, keeping the too distinct ones in diferent clusters. In many situations, it’s too expensive to obtain a set of features for these elements, being cheaper to obtain relational data, like the distance between elements. Many times it’s possible to compare elements using different criteria (visions), offering more information to distinguish, allowing the creation of distinct dissimilarity matrices. However, some visions can be irrelevants for the solution, because of that, multiple models were proposed that weight the visions, reducing the influence of the irelevant ones. In many situations, there are elements with caracteristics of multiple classes, in a way that to classify these elements in a single class doesn’t represent them very well. To better represent the elements in these situations, fuzzy classifications methods were develop, they define the elements membership degree for each class (in oposition to the crisp classification, that maps them in only one). The classification methods, just like other artificial inteligence methods, need to be tunned to obtein better results, using parameters for that. However, The more parameters a method has, the more expensive it becomes to search for good parameters. That way, to reduce the parameters number without affecting the results is an excellent improvement for a method. This dissertation aims to present a non-supervised fuzzy classification model for relation data with multiple visions. Being a variation of the FW4M model with one parameters less, but with similar or better results. The proposed method will be tested against the F4M model and two other models that have similar proposes ( and MFCMdd-RWG-P) on a group of datasets, using relevant metrics to compare the classifications considering both the fuzzy and crips partitions.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência computacionalClusterização difusaDados relacionaisAlgoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visõesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALDISSERTAÇÃO Eduardo Cintra Simões.pdfDISSERTAÇÃO Eduardo Cintra Simões.pdfapplication/pdf2788943https://repositorio.ufpe.br/bitstream/123456789/36683/1/DISSERTA%c3%87%c3%83O%20Eduardo%20Cintra%20Sim%c3%b5es.pdfe87ead8ec50ce8562a3c7abdb3ee48cbMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/36683/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82310https://repositorio.ufpe.br/bitstream/123456789/36683/3/license.txtbd573a5ca8288eb7272482765f819534MD53TEXTDISSERTAÇÃO Eduardo Cintra Simões.pdf.txtDISSERTAÇÃO Eduardo Cintra Simões.pdf.txtExtracted texttext/plain169781https://repositorio.ufpe.br/bitstream/123456789/36683/4/DISSERTA%c3%87%c3%83O%20Eduardo%20Cintra%20Sim%c3%b5es.pdf.txte2899807c1748aa86f8a46e79a0c7fe8MD54THUMBNAILDISSERTAÇÃO Eduardo Cintra Simões.pdf.jpgDISSERTAÇÃO Eduardo Cintra Simões.pdf.jpgGenerated Thumbnailimage/jpeg1246https://repositorio.ufpe.br/bitstream/123456789/36683/5/DISSERTA%c3%87%c3%83O%20Eduardo%20Cintra%20Sim%c3%b5es.pdf.jpgfbe49b14910db02fe99ad392cae14db1MD55123456789/366832020-02-29 02:15:50.782oai:repositorio.ufpe.br:123456789/36683TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLCBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91IGFjb3Jkby4KCkEgVUZQRSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBub21lKHMpIGRvKHMpIGF1dG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50byBlbnRyZWd1ZSBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZG8gcHJldmlzdG8gbmEgYWzDrW5lYSBjKS4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212020-02-29T05:15:50Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões
title Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões
spellingShingle Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões
SIMÕES, Eduardo Cintra
Inteligência computacional
Clusterização difusa
Dados relacionais
title_short Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões
title_full Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões
title_fullStr Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões
title_full_unstemmed Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões
title_sort Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões
author SIMÕES, Eduardo Cintra
author_facet SIMÕES, Eduardo Cintra
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/0683753132362016
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3909162572623711
dc.contributor.author.fl_str_mv SIMÕES, Eduardo Cintra
dc.contributor.advisor1.fl_str_mv CARVALHO, Francisco de Assis Tenório de
contributor_str_mv CARVALHO, Francisco de Assis Tenório de
dc.subject.por.fl_str_mv Inteligência computacional
Clusterização difusa
Dados relacionais
topic Inteligência computacional
Clusterização difusa
Dados relacionais
description Quando se deseja separar um conjunto de elementos sem um conhecimento prévio das suas classes, é necessário utilizar métodos de classificação não-supervisionada, que separam os elementos pelas suas similaridades, mantendo elementos muito distintos em grupos (clusters) diferentes. Contudo, obter um conjunto de características para os elementos pode ser mais custoso do que obter dados relacionais, como a similaridade entre os elementos. Muitas vezes é possível comparar os elementos com diferentes critérios (visões), o que oferece mais informações para distinguir os elementos, permitindo a geração de matrizes de dissimilaridade distintas. Contudo, nem sempre as visões são relevantes para a solução, por causa disso, vários modelos propostos ponderam as diferentes visões, reduzindo a influência daquelas irrelevantes. Em muitas situações, existem elementos com características de várias classes, de forma que classificar um elemento numa única classe não o representa bem. Para melhor representar os elementos nesse tipo de situação, foram desenvolvidos métodos de classificação difusa, que definem graus de pertinência dos elementos para cada classe (em oposição a classificação crisp, que mapeia cada elemento para apenas 1 classe). Os métodos de classificação, assim como vários outros métodos de inteligência artificial, precisam ser configurados para obter resultados melhores, utilizando um conjunto de parâmetros para isso. Contudo, quanto mais parâmetros um método possui, mais custoso se torna a busca por bons parâmetros. Dessa forma, reduzir o número de parâmetros sem afetar os resultados é uma excelente melhoria para um método. Esta dissertação tem como objetivo apresentar um modelo de classificação difusa não-supervisionada para dados relacionais com múltiplas visões. Sendo uma variação do modelo FW4M com um parâmetro a menos, mas com resultados similares ou melhores. O método proposto será comparado com o modelo FW4M e outros dois modelos com propósitos similares ( e MFCMdd-RWG-P) sobre um conjunto de bases de dados, utilizando métricas relevantes para comparar as classificações considerando tanto a partição difusa quanto a crisp.
publishDate 2019
dc.date.issued.fl_str_mv 2019-12-17
dc.date.accessioned.fl_str_mv 2020-02-28T18:13:54Z
dc.date.available.fl_str_mv 2020-02-28T18:13:54Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SIMÕES, Eduardo Cintra. Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões. 2019. Dissertação (Mestrado em Ciências da Computação) – Universidade Federal de Pernambuco., Recife, 2019.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/36683
identifier_str_mv SIMÕES, Eduardo Cintra. Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões. 2019. Dissertação (Mestrado em Ciências da Computação) – Universidade Federal de Pernambuco., Recife, 2019.
url https://repositorio.ufpe.br/handle/123456789/36683
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/36683/1/DISSERTA%c3%87%c3%83O%20Eduardo%20Cintra%20Sim%c3%b5es.pdf
https://repositorio.ufpe.br/bitstream/123456789/36683/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/36683/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/36683/4/DISSERTA%c3%87%c3%83O%20Eduardo%20Cintra%20Sim%c3%b5es.pdf.txt
https://repositorio.ufpe.br/bitstream/123456789/36683/5/DISSERTA%c3%87%c3%83O%20Eduardo%20Cintra%20Sim%c3%b5es.pdf.jpg
bitstream.checksum.fl_str_mv e87ead8ec50ce8562a3c7abdb3ee48cb
e39d27027a6cc9cb039ad269a5db8e34
bd573a5ca8288eb7272482765f819534
e2899807c1748aa86f8a46e79a0c7fe8
fbe49b14910db02fe99ad392cae14db1
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1802310810942308352