Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.22/15598 |
Resumo: | Em qualquer processo de aprendizagem automática, é importante saber quais os algoritmos que produzem melhores resultados na análise de um determinado conjunto de dados. Os algoritmos de agrupamento de dados são avaliados, principalmente, pela qualidade da exatidão (precisão) do agrupamento produzido quando comparado com a divisão real do conjunto de dados, pelo seu tempo de execução e pelos recursos utilizados (p.e., tempo de CPU). Com o conhecimento prévio de quais os algoritmos têm um melhor desempenho, o utilizador tem a oportunidade de usar esses algoritmos e obter uma melhor partição do conjunto de dados. O objetivo desta dissertação consiste no estudo de técnicas de agrupamento de dados associadas aos conceitos multi-grupo (cada objeto pode pertencer a mais do que um grupo) e multi-padrão (cada objeto pode ser caracterizados por mais do que um atributo, atributo esse que pode ser responsável pela classificação do objeto). Nesta dissertação são apresentados vários algoritmos de agrupamento multi-grupo e multipadrão e várias métricas de avaliação da qualidade da performance desses mesmos algoritmos. Esta dissertação apresenta dois estudos comparativos. Um entre algoritmos de agrupamento multi-grupo (LIFT, CLMLC, CBLML e HOMER) e outro entre algoritmos de agrupamento multipadrão (MCIL e BARTMIP). Os estudos comparam e avaliam a performance dos vários algoritmos para diferentes conjuntos de dados, dando indicações aos utilizadores de quais os algoritmos que obtiveram melhores resultados na performance do agrupamento de dados obtido. |
id |
RCAP_a1d3eb3b6590aab75982466d053c7d0c |
---|---|
oai_identifier_str |
oai:recipp.ipp.pt:10400.22/15598 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Técnicas de Agrupamento de Dados MultiGrupo e Multi-PadrãoAgrupamento de dadosAprendizagem Multi-GrupoAprendizagem MultiPadrão,Métricas de avaliaçãoData clusteringMulti-Label LearningMLCMulti-Instance LearningMICEvaluation metricsEm qualquer processo de aprendizagem automática, é importante saber quais os algoritmos que produzem melhores resultados na análise de um determinado conjunto de dados. Os algoritmos de agrupamento de dados são avaliados, principalmente, pela qualidade da exatidão (precisão) do agrupamento produzido quando comparado com a divisão real do conjunto de dados, pelo seu tempo de execução e pelos recursos utilizados (p.e., tempo de CPU). Com o conhecimento prévio de quais os algoritmos têm um melhor desempenho, o utilizador tem a oportunidade de usar esses algoritmos e obter uma melhor partição do conjunto de dados. O objetivo desta dissertação consiste no estudo de técnicas de agrupamento de dados associadas aos conceitos multi-grupo (cada objeto pode pertencer a mais do que um grupo) e multi-padrão (cada objeto pode ser caracterizados por mais do que um atributo, atributo esse que pode ser responsável pela classificação do objeto). Nesta dissertação são apresentados vários algoritmos de agrupamento multi-grupo e multipadrão e várias métricas de avaliação da qualidade da performance desses mesmos algoritmos. Esta dissertação apresenta dois estudos comparativos. Um entre algoritmos de agrupamento multi-grupo (LIFT, CLMLC, CBLML e HOMER) e outro entre algoritmos de agrupamento multipadrão (MCIL e BARTMIP). Os estudos comparam e avaliam a performance dos vários algoritmos para diferentes conjuntos de dados, dando indicações aos utilizadores de quais os algoritmos que obtiveram melhores resultados na performance do agrupamento de dados obtido.In any machine learning process, it is important to know which algorithms produce the best results when analysing a given dataset. Clustering algorithms are mainly evaluated by the accuracy and precision of the produced clusters when compared with the real divisions in the dataset, its execution time and the computing resources used (e.g., CPU time). With prior knowledge of which algorithms perform best, the user has the opportunity to use these algorithms and obtain a better partition of the dataset. This thesis objective is to study data clustering techniques associated with the multi-label concept (each object can belong to more than one group) and the multi-instance concept (each object can be characterized by more than one attribute, this attribute may be solely responsible by the object’s classification). In this thesis, several multi-label clustering and multi-instance clustering algorithms are presents, as well as several performance quality evaluation metrics of these same algorithms. This thesis presents two comparative studies. One a study between multi-label clustering algorithms (LIFT, CLMLC, CBLML and HOMER) and another between multi-instance algorithms (MCIL and BARTMIP). The studies compare and evaluate the performance of the various algorithms for different datasets, giving users an indication of which algorithms achieved the best results in these performance evalutions.Duarte, Fernando Jorge FerreiraRepositório Científico do Instituto Politécnico do PortoPereira, Hugo Fernando Freitas2020-03-16T16:12:12Z20192019-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/15598TID:202342913porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-13T12:59:42Zoai:recipp.ipp.pt:10400.22/15598Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:35:18.569555Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão |
title |
Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão |
spellingShingle |
Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão Pereira, Hugo Fernando Freitas Agrupamento de dados Aprendizagem Multi-Grupo Aprendizagem MultiPadrão, Métricas de avaliação Data clustering Multi-Label Learning MLC Multi-Instance Learning MIC Evaluation metrics |
title_short |
Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão |
title_full |
Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão |
title_fullStr |
Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão |
title_full_unstemmed |
Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão |
title_sort |
Técnicas de Agrupamento de Dados MultiGrupo e Multi-Padrão |
author |
Pereira, Hugo Fernando Freitas |
author_facet |
Pereira, Hugo Fernando Freitas |
author_role |
author |
dc.contributor.none.fl_str_mv |
Duarte, Fernando Jorge Ferreira Repositório Científico do Instituto Politécnico do Porto |
dc.contributor.author.fl_str_mv |
Pereira, Hugo Fernando Freitas |
dc.subject.por.fl_str_mv |
Agrupamento de dados Aprendizagem Multi-Grupo Aprendizagem MultiPadrão, Métricas de avaliação Data clustering Multi-Label Learning MLC Multi-Instance Learning MIC Evaluation metrics |
topic |
Agrupamento de dados Aprendizagem Multi-Grupo Aprendizagem MultiPadrão, Métricas de avaliação Data clustering Multi-Label Learning MLC Multi-Instance Learning MIC Evaluation metrics |
description |
Em qualquer processo de aprendizagem automática, é importante saber quais os algoritmos que produzem melhores resultados na análise de um determinado conjunto de dados. Os algoritmos de agrupamento de dados são avaliados, principalmente, pela qualidade da exatidão (precisão) do agrupamento produzido quando comparado com a divisão real do conjunto de dados, pelo seu tempo de execução e pelos recursos utilizados (p.e., tempo de CPU). Com o conhecimento prévio de quais os algoritmos têm um melhor desempenho, o utilizador tem a oportunidade de usar esses algoritmos e obter uma melhor partição do conjunto de dados. O objetivo desta dissertação consiste no estudo de técnicas de agrupamento de dados associadas aos conceitos multi-grupo (cada objeto pode pertencer a mais do que um grupo) e multi-padrão (cada objeto pode ser caracterizados por mais do que um atributo, atributo esse que pode ser responsável pela classificação do objeto). Nesta dissertação são apresentados vários algoritmos de agrupamento multi-grupo e multipadrão e várias métricas de avaliação da qualidade da performance desses mesmos algoritmos. Esta dissertação apresenta dois estudos comparativos. Um entre algoritmos de agrupamento multi-grupo (LIFT, CLMLC, CBLML e HOMER) e outro entre algoritmos de agrupamento multipadrão (MCIL e BARTMIP). Os estudos comparam e avaliam a performance dos vários algoritmos para diferentes conjuntos de dados, dando indicações aos utilizadores de quais os algoritmos que obtiveram melhores resultados na performance do agrupamento de dados obtido. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019 2019-01-01T00:00:00Z 2020-03-16T16:12:12Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.22/15598 TID:202342913 |
url |
http://hdl.handle.net/10400.22/15598 |
identifier_str_mv |
TID:202342913 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799131444574945280 |