Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/jspui/handle/123456789/26092 |
Resumo: | Com o aumento do tamanho dos conjuntos de dados utilizados em sistemas de classicação, a seleção dos atributos mais relevantes se tornou uma das principais tarefas dafase de pré-processamento. Em um conjunto de dados é esperado que todos os atributosque o descreve sejam relevantes, porém isso nem sempre acontece. Selecionar o conjuntode atributos mais relevantes ajuda a reduzir a dimensionalidade dos dados sem afetaro desempenho, ou até mesmo melhorá-lo, para que se possa obter melhores resultadosquando utilizado na classicação de dados. Os métodos de seleção de características existentesselecionam os melhores atributos para uma base de dados como um todo, sem levarem consideração as particularidades de cada instância. A Seleção de atributos baseadaem algoritmos de agrupamento, método proposto deste trabalho, seleciona os atributosmais relevantes para cada grupo de instâncias, utilizando algoritmos de agrupamentopara agrupá-las de acordo com as suas semelhanças. Este trabalho efetua uma análiseexperimental de diferentes técnicas de agrupamento aplicadas a essa nova abordagem deseleção de atributos. Para isso, são utilizados os algoritmos de agrupamento k-Médias,DBscan e Expectation-Maximization(EM) como métodos de seleção. São efetuadas aná-lises de desempenho e estatísticas para vericar qual desses algoritmos de agrupamentomelhor se adequa a essa nova Seleção de Atributos. Assim, a contribuição deste trabalho éapresentar uma nova abordagem, através de uma versão Semidinâmica e outra Dinâmica,para seleção de atributos baseada em algoritmos de agrupamento e determinar qual dosmétodos de agrupamento realiza uma melhor seleção e obtém um melhor desempenho naconstrução de classicadores mais acurados. |
id |
UFRN_37984a6c2784b390f0933eee901e58f9 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/26092 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Dantas, Carine Azevedohttp://lattes.cnpq.br/1357887401899097Carvalho, Bruno Motta Dehttp://lattes.cnpq.br/0330924133337698Araujo, Daniel Sabino Amorim Dehttp://lattes.cnpq.br/4744754780165354Junior, Joao Carlos Xavierhttp://lattes.cnpq.br/5088238300241110Takahashi, Adrianahttp://lattes.cnpq.br/0669090533992993Canuto, Anne Magaly De Paula2018-11-06T11:53:57Z2018-11-06T11:53:57Z2017-02-10DANTAS, Carine Azevedo. Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação. 2017. 70f. Dissertação (Mestrado Em Sistemas E Computação) - Centro De Ciências Exatas E Da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017.https://repositorio.ufrn.br/jspui/handle/123456789/26092Com o aumento do tamanho dos conjuntos de dados utilizados em sistemas de classicação, a seleção dos atributos mais relevantes se tornou uma das principais tarefas dafase de pré-processamento. Em um conjunto de dados é esperado que todos os atributosque o descreve sejam relevantes, porém isso nem sempre acontece. Selecionar o conjuntode atributos mais relevantes ajuda a reduzir a dimensionalidade dos dados sem afetaro desempenho, ou até mesmo melhorá-lo, para que se possa obter melhores resultadosquando utilizado na classicação de dados. Os métodos de seleção de características existentesselecionam os melhores atributos para uma base de dados como um todo, sem levarem consideração as particularidades de cada instância. A Seleção de atributos baseadaem algoritmos de agrupamento, método proposto deste trabalho, seleciona os atributosmais relevantes para cada grupo de instâncias, utilizando algoritmos de agrupamentopara agrupá-las de acordo com as suas semelhanças. Este trabalho efetua uma análiseexperimental de diferentes técnicas de agrupamento aplicadas a essa nova abordagem deseleção de atributos. Para isso, são utilizados os algoritmos de agrupamento k-Médias,DBscan e Expectation-Maximization(EM) como métodos de seleção. São efetuadas aná-lises de desempenho e estatísticas para vericar qual desses algoritmos de agrupamentomelhor se adequa a essa nova Seleção de Atributos. Assim, a contribuição deste trabalho éapresentar uma nova abordagem, através de uma versão Semidinâmica e outra Dinâmica,para seleção de atributos baseada em algoritmos de agrupamento e determinar qual dosmétodos de agrupamento realiza uma melhor seleção e obtém um melhor desempenho naconstrução de classicadores mais acurados.With the increase of the size on the data sets used in classi cation systems, selecting the most relevant attribute has become one of the main tasks in pre-processing phase. In a dataset, it is expected that all attributes are relevant. However, this is not always veri ed. Selecting a set of attributes of more relevance aids decreasing the size of the data without a ecting the performance, or even increase it, this way achieving better results when used in the data classi cation. The existing features selection methods elect the best attributes in the data base as a whole, without considering the particularities of each instance. The Unsupervised-based Feature Selection, proposed method, selects the relevant attributes for each instance individually, using clustering algorithms to group them accordingly with their similarities. This work performs an experimental analysis of di erent clustering techniques applied to this new feature selection approach. The clustering algorithms k-Means, DBSCAN and Expectation-Maximization (EM) were used as selection methods. Anaysis are performed to verify which of these clustering algorithms best ts to this new Feature Selection approach. Thus, the contribution of this study is to present a new approach for attribute selection, through a Semidynamic and a Dynamic version, and determine which of the clustering methods performs better selection and get a better performance in the construction of more accurate classi ers.porComitês de classificadoresSeleção de atributosAlgoritmos de agrupamentoSeleção de atributos baseado em algoritmos de agrupamento para tarefas de classificaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPrograma de pós-graduação em sistemas e computaçãoUFRNBrasilinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNTEXTAlgoritimoAgrupamento_Dantas_2017.pdf.txtAlgoritimoAgrupamento_Dantas_2017.pdf.txtExtracted texttext/plain116344https://repositorio.ufrn.br/bitstream/123456789/26092/2/AlgoritimoAgrupamento_Dantas_2017.pdf.txtdbb8972642bd76f11750f05badce4b75MD52THUMBNAILAlgoritimoAgrupamento_Dantas_2017.pdf.jpgAlgoritimoAgrupamento_Dantas_2017.pdf.jpgIM Thumbnailimage/jpeg3163https://repositorio.ufrn.br/bitstream/123456789/26092/3/AlgoritimoAgrupamento_Dantas_2017.pdf.jpg54e4bb8b7927bdda0eeab702eeab7fabMD53ORIGINALAlgoritimoAgrupamento_Dantas_2017.pdfapplication/pdf1177426https://repositorio.ufrn.br/bitstream/123456789/26092/1/AlgoritimoAgrupamento_Dantas_2017.pdf626599e0ebced828de539431bd17dcc2MD51123456789/260922019-01-30 10:15:34.418oai:https://repositorio.ufrn.br:123456789/26092Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2019-01-30T13:15:34Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação |
title |
Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação |
spellingShingle |
Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação Dantas, Carine Azevedo Comitês de classificadores Seleção de atributos Algoritmos de agrupamento |
title_short |
Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação |
title_full |
Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação |
title_fullStr |
Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação |
title_full_unstemmed |
Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação |
title_sort |
Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação |
author |
Dantas, Carine Azevedo |
author_facet |
Dantas, Carine Azevedo |
author_role |
author |
dc.contributor.authorID.pt_BR.fl_str_mv |
|
dc.contributor.advisorID.pt_BR.fl_str_mv |
|
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/1357887401899097 |
dc.contributor.referees1.none.fl_str_mv |
Carvalho, Bruno Motta De |
dc.contributor.referees1ID.pt_BR.fl_str_mv |
|
dc.contributor.referees1Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/0330924133337698 |
dc.contributor.referees2.none.fl_str_mv |
Araujo, Daniel Sabino Amorim De |
dc.contributor.referees2ID.pt_BR.fl_str_mv |
|
dc.contributor.referees2Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/4744754780165354 |
dc.contributor.referees3.none.fl_str_mv |
Junior, Joao Carlos Xavier |
dc.contributor.referees3ID.pt_BR.fl_str_mv |
|
dc.contributor.referees3Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/5088238300241110 |
dc.contributor.referees4.none.fl_str_mv |
Takahashi, Adriana |
dc.contributor.referees4ID.pt_BR.fl_str_mv |
|
dc.contributor.referees4Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/0669090533992993 |
dc.contributor.author.fl_str_mv |
Dantas, Carine Azevedo |
dc.contributor.advisor1.fl_str_mv |
Canuto, Anne Magaly De Paula |
contributor_str_mv |
Canuto, Anne Magaly De Paula |
dc.subject.por.fl_str_mv |
Comitês de classificadores Seleção de atributos Algoritmos de agrupamento |
topic |
Comitês de classificadores Seleção de atributos Algoritmos de agrupamento |
description |
Com o aumento do tamanho dos conjuntos de dados utilizados em sistemas de classicação, a seleção dos atributos mais relevantes se tornou uma das principais tarefas dafase de pré-processamento. Em um conjunto de dados é esperado que todos os atributosque o descreve sejam relevantes, porém isso nem sempre acontece. Selecionar o conjuntode atributos mais relevantes ajuda a reduzir a dimensionalidade dos dados sem afetaro desempenho, ou até mesmo melhorá-lo, para que se possa obter melhores resultadosquando utilizado na classicação de dados. Os métodos de seleção de características existentesselecionam os melhores atributos para uma base de dados como um todo, sem levarem consideração as particularidades de cada instância. A Seleção de atributos baseadaem algoritmos de agrupamento, método proposto deste trabalho, seleciona os atributosmais relevantes para cada grupo de instâncias, utilizando algoritmos de agrupamentopara agrupá-las de acordo com as suas semelhanças. Este trabalho efetua uma análiseexperimental de diferentes técnicas de agrupamento aplicadas a essa nova abordagem deseleção de atributos. Para isso, são utilizados os algoritmos de agrupamento k-Médias,DBscan e Expectation-Maximization(EM) como métodos de seleção. São efetuadas aná-lises de desempenho e estatísticas para vericar qual desses algoritmos de agrupamentomelhor se adequa a essa nova Seleção de Atributos. Assim, a contribuição deste trabalho éapresentar uma nova abordagem, através de uma versão Semidinâmica e outra Dinâmica,para seleção de atributos baseada em algoritmos de agrupamento e determinar qual dosmétodos de agrupamento realiza uma melhor seleção e obtém um melhor desempenho naconstrução de classicadores mais acurados. |
publishDate |
2017 |
dc.date.issued.fl_str_mv |
2017-02-10 |
dc.date.accessioned.fl_str_mv |
2018-11-06T11:53:57Z |
dc.date.available.fl_str_mv |
2018-11-06T11:53:57Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
DANTAS, Carine Azevedo. Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação. 2017. 70f. Dissertação (Mestrado Em Sistemas E Computação) - Centro De Ciências Exatas E Da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/jspui/handle/123456789/26092 |
identifier_str_mv |
DANTAS, Carine Azevedo. Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação. 2017. 70f. Dissertação (Mestrado Em Sistemas E Computação) - Centro De Ciências Exatas E Da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017. |
url |
https://repositorio.ufrn.br/jspui/handle/123456789/26092 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.program.fl_str_mv |
Programa de pós-graduação em sistemas e computação |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/26092/2/AlgoritimoAgrupamento_Dantas_2017.pdf.txt https://repositorio.ufrn.br/bitstream/123456789/26092/3/AlgoritimoAgrupamento_Dantas_2017.pdf.jpg https://repositorio.ufrn.br/bitstream/123456789/26092/1/AlgoritimoAgrupamento_Dantas_2017.pdf |
bitstream.checksum.fl_str_mv |
dbb8972642bd76f11750f05badce4b75 54e4bb8b7927bdda0eeab702eeab7fab 626599e0ebced828de539431bd17dcc2 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1814832666854293504 |