Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão

Pereira, Hugo Fernando Freitas

Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão

Detalhes bibliográficos
Autor(a) principal:	Pereira, Hugo Fernando Freitas
Data de Publicação:	2019
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo:	http://hdl.handle.net/10400.22/15598
Resumo:	Em qualquer processo de aprendizagem automática, é importante saber quais os algoritmos que produzem melhores resultados na análise de um determinado conjunto de dados. Os algoritmos de agrupamento de dados são avaliados, principalmente, pela qualidade da exatidão (precisão) do agrupamento produzido quando comparado com a divisão real do conjunto de dados, pelo seu tempo de execução e pelos recursos utilizados (p.e., tempo de CPU). Com o conhecimento prévio de quais os algoritmos têm um melhor desempenho, o utilizador tem a oportunidade de usar esses algoritmos e obter uma melhor partição do conjunto de dados. O objetivo desta dissertação consiste no estudo de técnicas de agrupamento de dados associadas aos conceitos multi-grupo (cada objeto pode pertencer a mais do que um grupo) e multi-padrão (cada objeto pode ser caracterizados por mais do que um atributo, atributo esse que pode ser responsável pela classificação do objeto). Nesta dissertação são apresentados vários algoritmos de agrupamento multi-grupo e multipadrão e várias métricas de avaliação da qualidade da performance desses mesmos algoritmos. Esta dissertação apresenta dois estudos comparativos. Um entre algoritmos de agrupamento multi-grupo (LIFT, CLMLC, CBLML e HOMER) e outro entre algoritmos de agrupamento multipadrão (MCIL e BARTMIP). Os estudos comparam e avaliam a performance dos vários algoritmos para diferentes conjuntos de dados, dando indicações aos utilizadores de quais os algoritmos que obtiveram melhores resultados na performance do agrupamento de dados obtido.

Metadados do item

id	RCAP_a1d3eb3b6590aab75982466d053c7d0c
oai_identifier_str	oai:recipp.ipp.pt:10400.22/15598
network_acronym_str	RCAP
network_name_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str	7160
spelling	Técnicas de Agrupamento de Dados MultiGrupo e Multi-PadrãoAgrupamento de dadosAprendizagem Multi-GrupoAprendizagem MultiPadrão,Métricas de avaliaçãoData clusteringMulti-Label LearningMLCMulti-Instance LearningMICEvaluation metricsEm qualquer processo de aprendizagem automática, é importante saber quais os algoritmos que produzem melhores resultados na análise de um determinado conjunto de dados. Os algoritmos de agrupamento de dados são avaliados, principalmente, pela qualidade da exatidão (precisão) do agrupamento produzido quando comparado com a divisão real do conjunto de dados, pelo seu tempo de execução e pelos recursos utilizados (p.e., tempo de CPU). Com o conhecimento prévio de quais os algoritmos têm um melhor desempenho, o utilizador tem a oportunidade de usar esses algoritmos e obter uma melhor partição do conjunto de dados. O objetivo desta dissertação consiste no estudo de técnicas de agrupamento de dados associadas aos conceitos multi-grupo (cada objeto pode pertencer a mais do que um grupo) e multi-padrão (cada objeto pode ser caracterizados por mais do que um atributo, atributo esse que pode ser responsável pela classificação do objeto). Nesta dissertação são apresentados vários algoritmos de agrupamento multi-grupo e multipadrão e várias métricas de avaliação da qualidade da performance desses mesmos algoritmos. Esta dissertação apresenta dois estudos comparativos. Um entre algoritmos de agrupamento multi-grupo (LIFT, CLMLC, CBLML e HOMER) e outro entre algoritmos de agrupamento multipadrão (MCIL e BARTMIP). Os estudos comparam e avaliam a performance dos vários algoritmos para diferentes conjuntos de dados, dando indicações aos utilizadores de quais os algoritmos que obtiveram melhores resultados na performance do agrupamento de dados obtido.In any machine learning process, it is important to know which algorithms produce the best results when analysing a given dataset. Clustering algorithms are mainly evaluated by the accuracy and precision of the produced clusters when compared with the real divisions in the dataset, its execution time and the computing resources used (e.g., CPU time). With prior knowledge of which algorithms perform best, the user has the opportunity to use these algorithms and obtain a better partition of the dataset. This thesis objective is to study data clustering techniques associated with the multi-label concept (each object can belong to more than one group) and the multi-instance concept (each object can be characterized by more than one attribute, this attribute may be solely responsible by the object’s classification). In this thesis, several multi-label clustering and multi-instance clustering algorithms are presents, as well as several performance quality evaluation metrics of these same algorithms. This thesis presents two comparative studies. One a study between multi-label clustering algorithms (LIFT, CLMLC, CBLML and HOMER) and another between multi-instance algorithms (MCIL and BARTMIP). The studies compare and evaluate the performance of the various algorithms for different datasets, giving users an indication of which algorithms achieved the best results in these performance evalutions.Duarte, Fernando Jorge FerreiraRepositório Científico do Instituto Politécnico do PortoPereira, Hugo Fernando Freitas2020-03-16T16:12:12Z20192019-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/15598TID:202342913porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-13T12:59:42Zoai:recipp.ipp.pt:10400.22/15598Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:35:18.569555Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv	Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão
title	Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão
spellingShingle	Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão Pereira, Hugo Fernando Freitas Agrupamento de dados Aprendizagem Multi-Grupo Aprendizagem MultiPadrão, Métricas de avaliação Data clustering Multi-Label Learning MLC Multi-Instance Learning MIC Evaluation metrics
title_short	Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão
title_full	Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão
title_fullStr	Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão
title_full_unstemmed	Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão
title_sort	Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão
author	Pereira, Hugo Fernando Freitas
author_facet	Pereira, Hugo Fernando Freitas
author_role	author
dc.contributor.none.fl_str_mv	Duarte, Fernando Jorge Ferreira Repositório Científico do Instituto Politécnico do Porto
dc.contributor.author.fl_str_mv	Pereira, Hugo Fernando Freitas
dc.subject.por.fl_str_mv	Agrupamento de dados Aprendizagem Multi-Grupo Aprendizagem MultiPadrão, Métricas de avaliação Data clustering Multi-Label Learning MLC Multi-Instance Learning MIC Evaluation metrics
topic	Agrupamento de dados Aprendizagem Multi-Grupo Aprendizagem MultiPadrão, Métricas de avaliação Data clustering Multi-Label Learning MLC Multi-Instance Learning MIC Evaluation metrics
description	Em qualquer processo de aprendizagem automática, é importante saber quais os algoritmos que produzem melhores resultados na análise de um determinado conjunto de dados. Os algoritmos de agrupamento de dados são avaliados, principalmente, pela qualidade da exatidão (precisão) do agrupamento produzido quando comparado com a divisão real do conjunto de dados, pelo seu tempo de execução e pelos recursos utilizados (p.e., tempo de CPU). Com o conhecimento prévio de quais os algoritmos têm um melhor desempenho, o utilizador tem a oportunidade de usar esses algoritmos e obter uma melhor partição do conjunto de dados. O objetivo desta dissertação consiste no estudo de técnicas de agrupamento de dados associadas aos conceitos multi-grupo (cada objeto pode pertencer a mais do que um grupo) e multi-padrão (cada objeto pode ser caracterizados por mais do que um atributo, atributo esse que pode ser responsável pela classificação do objeto). Nesta dissertação são apresentados vários algoritmos de agrupamento multi-grupo e multipadrão e várias métricas de avaliação da qualidade da performance desses mesmos algoritmos. Esta dissertação apresenta dois estudos comparativos. Um entre algoritmos de agrupamento multi-grupo (LIFT, CLMLC, CBLML e HOMER) e outro entre algoritmos de agrupamento multipadrão (MCIL e BARTMIP). Os estudos comparam e avaliam a performance dos vários algoritmos para diferentes conjuntos de dados, dando indicações aos utilizadores de quais os algoritmos que obtiveram melhores resultados na performance do agrupamento de dados obtido.
publishDate	2019
dc.date.none.fl_str_mv	2019 2019-01-01T00:00:00Z 2020-03-16T16:12:12Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10400.22/15598 TID:202342913
url	http://hdl.handle.net/10400.22/15598
identifier_str_mv	TID:202342913
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP
instname_str	Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str	RCAAP
institution	RCAAP
reponame_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_	1799131444574945280

Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão

Registros relacionados