Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/36683 |
Resumo: | Quando se deseja separar um conjunto de elementos sem um conhecimento prévio das suas classes, é necessário utilizar métodos de classificação não-supervisionada, que separam os elementos pelas suas similaridades, mantendo elementos muito distintos em grupos (clusters) diferentes. Contudo, obter um conjunto de características para os elementos pode ser mais custoso do que obter dados relacionais, como a similaridade entre os elementos. Muitas vezes é possível comparar os elementos com diferentes critérios (visões), o que oferece mais informações para distinguir os elementos, permitindo a geração de matrizes de dissimilaridade distintas. Contudo, nem sempre as visões são relevantes para a solução, por causa disso, vários modelos propostos ponderam as diferentes visões, reduzindo a influência daquelas irrelevantes. Em muitas situações, existem elementos com características de várias classes, de forma que classificar um elemento numa única classe não o representa bem. Para melhor representar os elementos nesse tipo de situação, foram desenvolvidos métodos de classificação difusa, que definem graus de pertinência dos elementos para cada classe (em oposição a classificação crisp, que mapeia cada elemento para apenas 1 classe). Os métodos de classificação, assim como vários outros métodos de inteligência artificial, precisam ser configurados para obter resultados melhores, utilizando um conjunto de parâmetros para isso. Contudo, quanto mais parâmetros um método possui, mais custoso se torna a busca por bons parâmetros. Dessa forma, reduzir o número de parâmetros sem afetar os resultados é uma excelente melhoria para um método. Esta dissertação tem como objetivo apresentar um modelo de classificação difusa não-supervisionada para dados relacionais com múltiplas visões. Sendo uma variação do modelo FW4M com um parâmetro a menos, mas com resultados similares ou melhores. O método proposto será comparado com o modelo FW4M e outros dois modelos com propósitos similares ( e MFCMdd-RWG-P) sobre um conjunto de bases de dados, utilizando métricas relevantes para comparar as classificações considerando tanto a partição difusa quanto a crisp. |
id |
UFPE_42e8e35be6af9a055425a6a722d75b18 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/36683 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
SIMÕES, Eduardo Cintrahttp://lattes.cnpq.br/0683753132362016http://lattes.cnpq.br/3909162572623711CARVALHO, Francisco de Assis Tenório de2020-02-28T18:13:54Z2020-02-28T18:13:54Z2019-12-17SIMÕES, Eduardo Cintra. Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões. 2019. Dissertação (Mestrado em Ciências da Computação) – Universidade Federal de Pernambuco., Recife, 2019.https://repositorio.ufpe.br/handle/123456789/36683Quando se deseja separar um conjunto de elementos sem um conhecimento prévio das suas classes, é necessário utilizar métodos de classificação não-supervisionada, que separam os elementos pelas suas similaridades, mantendo elementos muito distintos em grupos (clusters) diferentes. Contudo, obter um conjunto de características para os elementos pode ser mais custoso do que obter dados relacionais, como a similaridade entre os elementos. Muitas vezes é possível comparar os elementos com diferentes critérios (visões), o que oferece mais informações para distinguir os elementos, permitindo a geração de matrizes de dissimilaridade distintas. Contudo, nem sempre as visões são relevantes para a solução, por causa disso, vários modelos propostos ponderam as diferentes visões, reduzindo a influência daquelas irrelevantes. Em muitas situações, existem elementos com características de várias classes, de forma que classificar um elemento numa única classe não o representa bem. Para melhor representar os elementos nesse tipo de situação, foram desenvolvidos métodos de classificação difusa, que definem graus de pertinência dos elementos para cada classe (em oposição a classificação crisp, que mapeia cada elemento para apenas 1 classe). Os métodos de classificação, assim como vários outros métodos de inteligência artificial, precisam ser configurados para obter resultados melhores, utilizando um conjunto de parâmetros para isso. Contudo, quanto mais parâmetros um método possui, mais custoso se torna a busca por bons parâmetros. Dessa forma, reduzir o número de parâmetros sem afetar os resultados é uma excelente melhoria para um método. Esta dissertação tem como objetivo apresentar um modelo de classificação difusa não-supervisionada para dados relacionais com múltiplas visões. Sendo uma variação do modelo FW4M com um parâmetro a menos, mas com resultados similares ou melhores. O método proposto será comparado com o modelo FW4M e outros dois modelos com propósitos similares ( e MFCMdd-RWG-P) sobre um conjunto de bases de dados, utilizando métricas relevantes para comparar as classificações considerando tanto a partição difusa quanto a crisp.When one wants cluster objects without a previous knowledgement of its classes, it’s necessary to utilize non-supervised classification methods, which separate the elements based on their similarities, keeping the too distinct ones in diferent clusters. In many situations, it’s too expensive to obtain a set of features for these elements, being cheaper to obtain relational data, like the distance between elements. Many times it’s possible to compare elements using different criteria (visions), offering more information to distinguish, allowing the creation of distinct dissimilarity matrices. However, some visions can be irrelevants for the solution, because of that, multiple models were proposed that weight the visions, reducing the influence of the irelevant ones. In many situations, there are elements with caracteristics of multiple classes, in a way that to classify these elements in a single class doesn’t represent them very well. To better represent the elements in these situations, fuzzy classifications methods were develop, they define the elements membership degree for each class (in oposition to the crisp classification, that maps them in only one). The classification methods, just like other artificial inteligence methods, need to be tunned to obtein better results, using parameters for that. However, The more parameters a method has, the more expensive it becomes to search for good parameters. That way, to reduce the parameters number without affecting the results is an excellent improvement for a method. This dissertation aims to present a non-supervised fuzzy classification model for relation data with multiple visions. Being a variation of the FW4M model with one parameters less, but with similar or better results. The proposed method will be tested against the F4M model and two other models that have similar proposes ( and MFCMdd-RWG-P) on a group of datasets, using relevant metrics to compare the classifications considering both the fuzzy and crips partitions.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência computacionalClusterização difusaDados relacionaisAlgoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visõesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALDISSERTAÇÃO Eduardo Cintra Simões.pdfDISSERTAÇÃO Eduardo Cintra Simões.pdfapplication/pdf2788943https://repositorio.ufpe.br/bitstream/123456789/36683/1/DISSERTA%c3%87%c3%83O%20Eduardo%20Cintra%20Sim%c3%b5es.pdfe87ead8ec50ce8562a3c7abdb3ee48cbMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/36683/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82310https://repositorio.ufpe.br/bitstream/123456789/36683/3/license.txtbd573a5ca8288eb7272482765f819534MD53TEXTDISSERTAÇÃO Eduardo Cintra Simões.pdf.txtDISSERTAÇÃO Eduardo Cintra Simões.pdf.txtExtracted texttext/plain169781https://repositorio.ufpe.br/bitstream/123456789/36683/4/DISSERTA%c3%87%c3%83O%20Eduardo%20Cintra%20Sim%c3%b5es.pdf.txte2899807c1748aa86f8a46e79a0c7fe8MD54THUMBNAILDISSERTAÇÃO Eduardo Cintra Simões.pdf.jpgDISSERTAÇÃO Eduardo Cintra Simões.pdf.jpgGenerated Thumbnailimage/jpeg1246https://repositorio.ufpe.br/bitstream/123456789/36683/5/DISSERTA%c3%87%c3%83O%20Eduardo%20Cintra%20Sim%c3%b5es.pdf.jpgfbe49b14910db02fe99ad392cae14db1MD55123456789/366832020-02-29 02:15:50.782oai:repositorio.ufpe.br:123456789/36683TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLCBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91IGFjb3Jkby4KCkEgVUZQRSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBub21lKHMpIGRvKHMpIGF1dG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50byBlbnRyZWd1ZSBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZG8gcHJldmlzdG8gbmEgYWzDrW5lYSBjKS4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212020-02-29T05:15:50Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões |
title |
Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões |
spellingShingle |
Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões SIMÕES, Eduardo Cintra Inteligência computacional Clusterização difusa Dados relacionais |
title_short |
Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões |
title_full |
Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões |
title_fullStr |
Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões |
title_full_unstemmed |
Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões |
title_sort |
Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões |
author |
SIMÕES, Eduardo Cintra |
author_facet |
SIMÕES, Eduardo Cintra |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/0683753132362016 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3909162572623711 |
dc.contributor.author.fl_str_mv |
SIMÕES, Eduardo Cintra |
dc.contributor.advisor1.fl_str_mv |
CARVALHO, Francisco de Assis Tenório de |
contributor_str_mv |
CARVALHO, Francisco de Assis Tenório de |
dc.subject.por.fl_str_mv |
Inteligência computacional Clusterização difusa Dados relacionais |
topic |
Inteligência computacional Clusterização difusa Dados relacionais |
description |
Quando se deseja separar um conjunto de elementos sem um conhecimento prévio das suas classes, é necessário utilizar métodos de classificação não-supervisionada, que separam os elementos pelas suas similaridades, mantendo elementos muito distintos em grupos (clusters) diferentes. Contudo, obter um conjunto de características para os elementos pode ser mais custoso do que obter dados relacionais, como a similaridade entre os elementos. Muitas vezes é possível comparar os elementos com diferentes critérios (visões), o que oferece mais informações para distinguir os elementos, permitindo a geração de matrizes de dissimilaridade distintas. Contudo, nem sempre as visões são relevantes para a solução, por causa disso, vários modelos propostos ponderam as diferentes visões, reduzindo a influência daquelas irrelevantes. Em muitas situações, existem elementos com características de várias classes, de forma que classificar um elemento numa única classe não o representa bem. Para melhor representar os elementos nesse tipo de situação, foram desenvolvidos métodos de classificação difusa, que definem graus de pertinência dos elementos para cada classe (em oposição a classificação crisp, que mapeia cada elemento para apenas 1 classe). Os métodos de classificação, assim como vários outros métodos de inteligência artificial, precisam ser configurados para obter resultados melhores, utilizando um conjunto de parâmetros para isso. Contudo, quanto mais parâmetros um método possui, mais custoso se torna a busca por bons parâmetros. Dessa forma, reduzir o número de parâmetros sem afetar os resultados é uma excelente melhoria para um método. Esta dissertação tem como objetivo apresentar um modelo de classificação difusa não-supervisionada para dados relacionais com múltiplas visões. Sendo uma variação do modelo FW4M com um parâmetro a menos, mas com resultados similares ou melhores. O método proposto será comparado com o modelo FW4M e outros dois modelos com propósitos similares ( e MFCMdd-RWG-P) sobre um conjunto de bases de dados, utilizando métricas relevantes para comparar as classificações considerando tanto a partição difusa quanto a crisp. |
publishDate |
2019 |
dc.date.issued.fl_str_mv |
2019-12-17 |
dc.date.accessioned.fl_str_mv |
2020-02-28T18:13:54Z |
dc.date.available.fl_str_mv |
2020-02-28T18:13:54Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SIMÕES, Eduardo Cintra. Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões. 2019. Dissertação (Mestrado em Ciências da Computação) – Universidade Federal de Pernambuco., Recife, 2019. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/36683 |
identifier_str_mv |
SIMÕES, Eduardo Cintra. Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões. 2019. Dissertação (Mestrado em Ciências da Computação) – Universidade Federal de Pernambuco., Recife, 2019. |
url |
https://repositorio.ufpe.br/handle/123456789/36683 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/36683/1/DISSERTA%c3%87%c3%83O%20Eduardo%20Cintra%20Sim%c3%b5es.pdf https://repositorio.ufpe.br/bitstream/123456789/36683/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/36683/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/36683/4/DISSERTA%c3%87%c3%83O%20Eduardo%20Cintra%20Sim%c3%b5es.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/36683/5/DISSERTA%c3%87%c3%83O%20Eduardo%20Cintra%20Sim%c3%b5es.pdf.jpg |
bitstream.checksum.fl_str_mv |
e87ead8ec50ce8562a3c7abdb3ee48cb e39d27027a6cc9cb039ad269a5db8e34 bd573a5ca8288eb7272482765f819534 e2899807c1748aa86f8a46e79a0c7fe8 fbe49b14910db02fe99ad392cae14db1 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1802310810942308352 |