Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.

Detalhes bibliográficos
Autor(a) principal: Santoro, Daniel Monegatto
Data de Publicação: 2005
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/594
Resumo: Inductive machine learning methods learn the expression of the concept from a training set. Training sets are, generally, composed by instances described by attributevalue pairs and an associated class. The attribute set used for describing the training instances has a strong impact on the induced concepts. In a machine learning environment, attribute subset selection techniques aim at the identification of the attributes which effectively contribute for establishing the class of an instance. These techniques can be characterized as wrappers (if they are associated with a specific machine learning method) or filter and many of them work in conjunction with a search method (there are also embedded feature selection methods, not very representative). This work approaches the attribute subset selection problem by investigating the performance of two families of wrappers the NN (Nearest Neighbor) and DistAl families and three filter families Relief, Focus and LVF. The many members of the NN family (as well as of the DistAl family) differ among themselves with relation to the search method they use. The work presents and discusses the experiments conducted in many knowledge domains and their results allow a comparative evaluation (as far as accuracy and dimensionality are concerned) among the members of the families.
id SCAR_49ba157d0b356787ca65c95140e9f84a
oai_identifier_str oai:repositorio.ufscar.br:ufscar/594
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Santoro, Daniel MonegattoNicoletti, Maria do Carmohttp://genos.cnpq.br:12010/dwlattes/owa/prc_imp_cv_int?f_cod=K4787728A5http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4771205U92016-06-02T19:06:20Z2005-06-032016-06-02T19:06:20Z2005-04-28SANTORO, Daniel Monegatto. Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.. 2005. 153 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005.https://repositorio.ufscar.br/handle/ufscar/594Inductive machine learning methods learn the expression of the concept from a training set. Training sets are, generally, composed by instances described by attributevalue pairs and an associated class. The attribute set used for describing the training instances has a strong impact on the induced concepts. In a machine learning environment, attribute subset selection techniques aim at the identification of the attributes which effectively contribute for establishing the class of an instance. These techniques can be characterized as wrappers (if they are associated with a specific machine learning method) or filter and many of them work in conjunction with a search method (there are also embedded feature selection methods, not very representative). This work approaches the attribute subset selection problem by investigating the performance of two families of wrappers the NN (Nearest Neighbor) and DistAl families and three filter families Relief, Focus and LVF. The many members of the NN family (as well as of the DistAl family) differ among themselves with relation to the search method they use. The work presents and discusses the experiments conducted in many knowledge domains and their results allow a comparative evaluation (as far as accuracy and dimensionality are concerned) among the members of the families.Métodos indutivos de aprendizado de máquina aprendem a expressão do conceito a partir de um conjunto de treinamento. Conjuntos de treinamento são, na maioria das vezes, compostos por instâncias descritas por pares atributo-valor e uma classe associada. O conjunto de atributos usado para descrever as instâncias de treinamento tem um forte impacto na expressão induzida do conceito. As técnicas para a seleção de subconjuntos de atributos no contexto de aprendizado de máquina objetivam identificar os atributos que efetivamente contribuem para a caracterização da classe de uma instância. Essas técnicas podem ser caracterizadas como do tipo wrapper (se estão associadas a um método específico de aprendizado de máquina) ou filtro e muitas delas funcionam articuladas a um método de busca (há ainda o tipo integrado, pouco representativo). Este trabalho aborda o problema de seleção de subconjuntos de atributos por meio da investigação do desempenho de duas famílias de wrappers a família NN (Neareast Neighbor) e a DistAl e de três famílias de filtros Relief, Focus e LVF. Os vários integrantes da família NN (bem como da família DistAl) diferem entre si com relação ao método de busca utilizado. O trabalho apresenta e discute os experimentos realizados em vários domínios de conhecimento e seus resultados permitem uma avaliação comparativa de desempenho (precisão e dimensionalidade) dos elementos das várias famílias avaliadas.Universidade Federal de Sao Carlosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRInteligência artificialAprendizado do computadorMétodos de buscaSeleção de atributosCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOSobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissDMS.pdfapplication/pdf4319162https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/594/1/DissDMS.pdf520f8924dcc0b2471665008a2ea3ec5aMD51THUMBNAILDissDMS.pdf.jpgDissDMS.pdf.jpgIM Thumbnailimage/jpeg9583https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/594/2/DissDMS.pdf.jpg9d1137ef3f18724c411c8a66cf713283MD52ufscar/5942020-03-23 19:47:32.53oai:repositorio.ufscar.br:ufscar/594Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222020-03-23T19:47:32Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.
title Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.
spellingShingle Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.
Santoro, Daniel Monegatto
Inteligência artificial
Aprendizado do computador
Métodos de busca
Seleção de atributos
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.
title_full Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.
title_fullStr Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.
title_full_unstemmed Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.
title_sort Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.
author Santoro, Daniel Monegatto
author_facet Santoro, Daniel Monegatto
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4771205U9
dc.contributor.author.fl_str_mv Santoro, Daniel Monegatto
dc.contributor.advisor1.fl_str_mv Nicoletti, Maria do Carmo
dc.contributor.advisor1Lattes.fl_str_mv http://genos.cnpq.br:12010/dwlattes/owa/prc_imp_cv_int?f_cod=K4787728A5
contributor_str_mv Nicoletti, Maria do Carmo
dc.subject.por.fl_str_mv Inteligência artificial
Aprendizado do computador
Métodos de busca
Seleção de atributos
topic Inteligência artificial
Aprendizado do computador
Métodos de busca
Seleção de atributos
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Inductive machine learning methods learn the expression of the concept from a training set. Training sets are, generally, composed by instances described by attributevalue pairs and an associated class. The attribute set used for describing the training instances has a strong impact on the induced concepts. In a machine learning environment, attribute subset selection techniques aim at the identification of the attributes which effectively contribute for establishing the class of an instance. These techniques can be characterized as wrappers (if they are associated with a specific machine learning method) or filter and many of them work in conjunction with a search method (there are also embedded feature selection methods, not very representative). This work approaches the attribute subset selection problem by investigating the performance of two families of wrappers the NN (Nearest Neighbor) and DistAl families and three filter families Relief, Focus and LVF. The many members of the NN family (as well as of the DistAl family) differ among themselves with relation to the search method they use. The work presents and discusses the experiments conducted in many knowledge domains and their results allow a comparative evaluation (as far as accuracy and dimensionality are concerned) among the members of the families.
publishDate 2005
dc.date.available.fl_str_mv 2005-06-03
2016-06-02T19:06:20Z
dc.date.issued.fl_str_mv 2005-04-28
dc.date.accessioned.fl_str_mv 2016-06-02T19:06:20Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SANTORO, Daniel Monegatto. Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.. 2005. 153 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/594
identifier_str_mv SANTORO, Daniel Monegatto. Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.. 2005. 153 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005.
url https://repositorio.ufscar.br/handle/ufscar/594
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/594/1/DissDMS.pdf
https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/594/2/DissDMS.pdf.jpg
bitstream.checksum.fl_str_mv 520f8924dcc0b2471665008a2ea3ec5a
9d1137ef3f18724c411c8a66cf713283
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1777472017118789632