Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação

Detalhes bibliográficos
Autor(a) principal: Dantas, Carine Azevedo
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/jspui/handle/123456789/26092
Resumo: Com o aumento do tamanho dos conjuntos de dados utilizados em sistemas de classicação, a seleção dos atributos mais relevantes se tornou uma das principais tarefas dafase de pré-processamento. Em um conjunto de dados é esperado que todos os atributosque o descreve sejam relevantes, porém isso nem sempre acontece. Selecionar o conjuntode atributos mais relevantes ajuda a reduzir a dimensionalidade dos dados sem afetaro desempenho, ou até mesmo melhorá-lo, para que se possa obter melhores resultadosquando utilizado na classicação de dados. Os métodos de seleção de características existentesselecionam os melhores atributos para uma base de dados como um todo, sem levarem consideração as particularidades de cada instância. A Seleção de atributos baseadaem algoritmos de agrupamento, método proposto deste trabalho, seleciona os atributosmais relevantes para cada grupo de instâncias, utilizando algoritmos de agrupamentopara agrupá-las de acordo com as suas semelhanças. Este trabalho efetua uma análiseexperimental de diferentes técnicas de agrupamento aplicadas a essa nova abordagem deseleção de atributos. Para isso, são utilizados os algoritmos de agrupamento k-Médias,DBscan e Expectation-Maximization(EM) como métodos de seleção. São efetuadas aná-lises de desempenho e estatísticas para vericar qual desses algoritmos de agrupamentomelhor se adequa a essa nova Seleção de Atributos. Assim, a contribuição deste trabalho éapresentar uma nova abordagem, através de uma versão Semidinâmica e outra Dinâmica,para seleção de atributos baseada em algoritmos de agrupamento e determinar qual dosmétodos de agrupamento realiza uma melhor seleção e obtém um melhor desempenho naconstrução de classicadores mais acurados.
id UFRN_37984a6c2784b390f0933eee901e58f9
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/26092
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Dantas, Carine Azevedohttp://lattes.cnpq.br/1357887401899097Carvalho, Bruno Motta Dehttp://lattes.cnpq.br/0330924133337698Araujo, Daniel Sabino Amorim Dehttp://lattes.cnpq.br/4744754780165354Junior, Joao Carlos Xavierhttp://lattes.cnpq.br/5088238300241110Takahashi, Adrianahttp://lattes.cnpq.br/0669090533992993Canuto, Anne Magaly De Paula2018-11-06T11:53:57Z2018-11-06T11:53:57Z2017-02-10DANTAS, Carine Azevedo. Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação. 2017. 70f. Dissertação (Mestrado Em Sistemas E Computação) - Centro De Ciências Exatas E Da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017.https://repositorio.ufrn.br/jspui/handle/123456789/26092Com o aumento do tamanho dos conjuntos de dados utilizados em sistemas de classicação, a seleção dos atributos mais relevantes se tornou uma das principais tarefas dafase de pré-processamento. Em um conjunto de dados é esperado que todos os atributosque o descreve sejam relevantes, porém isso nem sempre acontece. Selecionar o conjuntode atributos mais relevantes ajuda a reduzir a dimensionalidade dos dados sem afetaro desempenho, ou até mesmo melhorá-lo, para que se possa obter melhores resultadosquando utilizado na classicação de dados. Os métodos de seleção de características existentesselecionam os melhores atributos para uma base de dados como um todo, sem levarem consideração as particularidades de cada instância. A Seleção de atributos baseadaem algoritmos de agrupamento, método proposto deste trabalho, seleciona os atributosmais relevantes para cada grupo de instâncias, utilizando algoritmos de agrupamentopara agrupá-las de acordo com as suas semelhanças. Este trabalho efetua uma análiseexperimental de diferentes técnicas de agrupamento aplicadas a essa nova abordagem deseleção de atributos. Para isso, são utilizados os algoritmos de agrupamento k-Médias,DBscan e Expectation-Maximization(EM) como métodos de seleção. São efetuadas aná-lises de desempenho e estatísticas para vericar qual desses algoritmos de agrupamentomelhor se adequa a essa nova Seleção de Atributos. Assim, a contribuição deste trabalho éapresentar uma nova abordagem, através de uma versão Semidinâmica e outra Dinâmica,para seleção de atributos baseada em algoritmos de agrupamento e determinar qual dosmétodos de agrupamento realiza uma melhor seleção e obtém um melhor desempenho naconstrução de classicadores mais acurados.With the increase of the size on the data sets used in classi cation systems, selecting the most relevant attribute has become one of the main tasks in pre-processing phase. In a dataset, it is expected that all attributes are relevant. However, this is not always veri ed. Selecting a set of attributes of more relevance aids decreasing the size of the data without a ecting the performance, or even increase it, this way achieving better results when used in the data classi cation. The existing features selection methods elect the best attributes in the data base as a whole, without considering the particularities of each instance. The Unsupervised-based Feature Selection, proposed method, selects the relevant attributes for each instance individually, using clustering algorithms to group them accordingly with their similarities. This work performs an experimental analysis of di erent clustering techniques applied to this new feature selection approach. The clustering algorithms k-Means, DBSCAN and Expectation-Maximization (EM) were used as selection methods. Anaysis are performed to verify which of these clustering algorithms best ts to this new Feature Selection approach. Thus, the contribution of this study is to present a new approach for attribute selection, through a Semidynamic and a Dynamic version, and determine which of the clustering methods performs better selection and get a better performance in the construction of more accurate classi ers.porComitês de classificadoresSeleção de atributosAlgoritmos de agrupamentoSeleção de atributos baseado em algoritmos de agrupamento para tarefas de classificaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPrograma de pós-graduação em sistemas e computaçãoUFRNBrasilinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNTEXTAlgoritimoAgrupamento_Dantas_2017.pdf.txtAlgoritimoAgrupamento_Dantas_2017.pdf.txtExtracted texttext/plain116344https://repositorio.ufrn.br/bitstream/123456789/26092/2/AlgoritimoAgrupamento_Dantas_2017.pdf.txtdbb8972642bd76f11750f05badce4b75MD52THUMBNAILAlgoritimoAgrupamento_Dantas_2017.pdf.jpgAlgoritimoAgrupamento_Dantas_2017.pdf.jpgIM Thumbnailimage/jpeg3163https://repositorio.ufrn.br/bitstream/123456789/26092/3/AlgoritimoAgrupamento_Dantas_2017.pdf.jpg54e4bb8b7927bdda0eeab702eeab7fabMD53ORIGINALAlgoritimoAgrupamento_Dantas_2017.pdfapplication/pdf1177426https://repositorio.ufrn.br/bitstream/123456789/26092/1/AlgoritimoAgrupamento_Dantas_2017.pdf626599e0ebced828de539431bd17dcc2MD51123456789/260922019-01-30 10:15:34.418oai:https://repositorio.ufrn.br:123456789/26092Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2019-01-30T13:15:34Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação
title Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação
spellingShingle Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação
Dantas, Carine Azevedo
Comitês de classificadores
Seleção de atributos
Algoritmos de agrupamento
title_short Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação
title_full Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação
title_fullStr Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação
title_full_unstemmed Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação
title_sort Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação
author Dantas, Carine Azevedo
author_facet Dantas, Carine Azevedo
author_role author
dc.contributor.authorID.pt_BR.fl_str_mv
dc.contributor.advisorID.pt_BR.fl_str_mv
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1357887401899097
dc.contributor.referees1.none.fl_str_mv Carvalho, Bruno Motta De
dc.contributor.referees1ID.pt_BR.fl_str_mv
dc.contributor.referees1Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/0330924133337698
dc.contributor.referees2.none.fl_str_mv Araujo, Daniel Sabino Amorim De
dc.contributor.referees2ID.pt_BR.fl_str_mv
dc.contributor.referees2Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/4744754780165354
dc.contributor.referees3.none.fl_str_mv Junior, Joao Carlos Xavier
dc.contributor.referees3ID.pt_BR.fl_str_mv
dc.contributor.referees3Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/5088238300241110
dc.contributor.referees4.none.fl_str_mv Takahashi, Adriana
dc.contributor.referees4ID.pt_BR.fl_str_mv
dc.contributor.referees4Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/0669090533992993
dc.contributor.author.fl_str_mv Dantas, Carine Azevedo
dc.contributor.advisor1.fl_str_mv Canuto, Anne Magaly De Paula
contributor_str_mv Canuto, Anne Magaly De Paula
dc.subject.por.fl_str_mv Comitês de classificadores
Seleção de atributos
Algoritmos de agrupamento
topic Comitês de classificadores
Seleção de atributos
Algoritmos de agrupamento
description Com o aumento do tamanho dos conjuntos de dados utilizados em sistemas de classicação, a seleção dos atributos mais relevantes se tornou uma das principais tarefas dafase de pré-processamento. Em um conjunto de dados é esperado que todos os atributosque o descreve sejam relevantes, porém isso nem sempre acontece. Selecionar o conjuntode atributos mais relevantes ajuda a reduzir a dimensionalidade dos dados sem afetaro desempenho, ou até mesmo melhorá-lo, para que se possa obter melhores resultadosquando utilizado na classicação de dados. Os métodos de seleção de características existentesselecionam os melhores atributos para uma base de dados como um todo, sem levarem consideração as particularidades de cada instância. A Seleção de atributos baseadaem algoritmos de agrupamento, método proposto deste trabalho, seleciona os atributosmais relevantes para cada grupo de instâncias, utilizando algoritmos de agrupamentopara agrupá-las de acordo com as suas semelhanças. Este trabalho efetua uma análiseexperimental de diferentes técnicas de agrupamento aplicadas a essa nova abordagem deseleção de atributos. Para isso, são utilizados os algoritmos de agrupamento k-Médias,DBscan e Expectation-Maximization(EM) como métodos de seleção. São efetuadas aná-lises de desempenho e estatísticas para vericar qual desses algoritmos de agrupamentomelhor se adequa a essa nova Seleção de Atributos. Assim, a contribuição deste trabalho éapresentar uma nova abordagem, através de uma versão Semidinâmica e outra Dinâmica,para seleção de atributos baseada em algoritmos de agrupamento e determinar qual dosmétodos de agrupamento realiza uma melhor seleção e obtém um melhor desempenho naconstrução de classicadores mais acurados.
publishDate 2017
dc.date.issued.fl_str_mv 2017-02-10
dc.date.accessioned.fl_str_mv 2018-11-06T11:53:57Z
dc.date.available.fl_str_mv 2018-11-06T11:53:57Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv DANTAS, Carine Azevedo. Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação. 2017. 70f. Dissertação (Mestrado Em Sistemas E Computação) - Centro De Ciências Exatas E Da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/jspui/handle/123456789/26092
identifier_str_mv DANTAS, Carine Azevedo. Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação. 2017. 70f. Dissertação (Mestrado Em Sistemas E Computação) - Centro De Ciências Exatas E Da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017.
url https://repositorio.ufrn.br/jspui/handle/123456789/26092
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.program.fl_str_mv Programa de pós-graduação em sistemas e computação
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/26092/2/AlgoritimoAgrupamento_Dantas_2017.pdf.txt
https://repositorio.ufrn.br/bitstream/123456789/26092/3/AlgoritimoAgrupamento_Dantas_2017.pdf.jpg
https://repositorio.ufrn.br/bitstream/123456789/26092/1/AlgoritimoAgrupamento_Dantas_2017.pdf
bitstream.checksum.fl_str_mv dbb8972642bd76f11750f05badce4b75
54e4bb8b7927bdda0eeab702eeab7fab
626599e0ebced828de539431bd17dcc2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814832666854293504