Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2005 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/594 |
Resumo: | Inductive machine learning methods learn the expression of the concept from a training set. Training sets are, generally, composed by instances described by attributevalue pairs and an associated class. The attribute set used for describing the training instances has a strong impact on the induced concepts. In a machine learning environment, attribute subset selection techniques aim at the identification of the attributes which effectively contribute for establishing the class of an instance. These techniques can be characterized as wrappers (if they are associated with a specific machine learning method) or filter and many of them work in conjunction with a search method (there are also embedded feature selection methods, not very representative). This work approaches the attribute subset selection problem by investigating the performance of two families of wrappers the NN (Nearest Neighbor) and DistAl families and three filter families Relief, Focus and LVF. The many members of the NN family (as well as of the DistAl family) differ among themselves with relation to the search method they use. The work presents and discusses the experiments conducted in many knowledge domains and their results allow a comparative evaluation (as far as accuracy and dimensionality are concerned) among the members of the families. |
id |
SCAR_49ba157d0b356787ca65c95140e9f84a |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/594 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
|
spelling |
Santoro, Daniel MonegattoNicoletti, Maria do Carmohttp://genos.cnpq.br:12010/dwlattes/owa/prc_imp_cv_int?f_cod=K4787728A5http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4771205U92016-06-02T19:06:20Z2005-06-032016-06-02T19:06:20Z2005-04-28SANTORO, Daniel Monegatto. Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.. 2005. 153 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005.https://repositorio.ufscar.br/handle/ufscar/594Inductive machine learning methods learn the expression of the concept from a training set. Training sets are, generally, composed by instances described by attributevalue pairs and an associated class. The attribute set used for describing the training instances has a strong impact on the induced concepts. In a machine learning environment, attribute subset selection techniques aim at the identification of the attributes which effectively contribute for establishing the class of an instance. These techniques can be characterized as wrappers (if they are associated with a specific machine learning method) or filter and many of them work in conjunction with a search method (there are also embedded feature selection methods, not very representative). This work approaches the attribute subset selection problem by investigating the performance of two families of wrappers the NN (Nearest Neighbor) and DistAl families and three filter families Relief, Focus and LVF. The many members of the NN family (as well as of the DistAl family) differ among themselves with relation to the search method they use. The work presents and discusses the experiments conducted in many knowledge domains and their results allow a comparative evaluation (as far as accuracy and dimensionality are concerned) among the members of the families.Métodos indutivos de aprendizado de máquina aprendem a expressão do conceito a partir de um conjunto de treinamento. Conjuntos de treinamento são, na maioria das vezes, compostos por instâncias descritas por pares atributo-valor e uma classe associada. O conjunto de atributos usado para descrever as instâncias de treinamento tem um forte impacto na expressão induzida do conceito. As técnicas para a seleção de subconjuntos de atributos no contexto de aprendizado de máquina objetivam identificar os atributos que efetivamente contribuem para a caracterização da classe de uma instância. Essas técnicas podem ser caracterizadas como do tipo wrapper (se estão associadas a um método específico de aprendizado de máquina) ou filtro e muitas delas funcionam articuladas a um método de busca (há ainda o tipo integrado, pouco representativo). Este trabalho aborda o problema de seleção de subconjuntos de atributos por meio da investigação do desempenho de duas famílias de wrappers a família NN (Neareast Neighbor) e a DistAl e de três famílias de filtros Relief, Focus e LVF. Os vários integrantes da família NN (bem como da família DistAl) diferem entre si com relação ao método de busca utilizado. O trabalho apresenta e discute os experimentos realizados em vários domínios de conhecimento e seus resultados permitem uma avaliação comparativa de desempenho (precisão e dimensionalidade) dos elementos das várias famílias avaliadas.Universidade Federal de Sao Carlosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRInteligência artificialAprendizado do computadorMétodos de buscaSeleção de atributosCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOSobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissDMS.pdfapplication/pdf4319162https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/594/1/DissDMS.pdf520f8924dcc0b2471665008a2ea3ec5aMD51THUMBNAILDissDMS.pdf.jpgDissDMS.pdf.jpgIM Thumbnailimage/jpeg9583https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/594/2/DissDMS.pdf.jpg9d1137ef3f18724c411c8a66cf713283MD52ufscar/5942020-03-23 19:47:32.53oai:repositorio.ufscar.br:ufscar/594Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222020-03-23T19:47:32Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper. |
title |
Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper. |
spellingShingle |
Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper. Santoro, Daniel Monegatto Inteligência artificial Aprendizado do computador Métodos de busca Seleção de atributos CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper. |
title_full |
Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper. |
title_fullStr |
Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper. |
title_full_unstemmed |
Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper. |
title_sort |
Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper. |
author |
Santoro, Daniel Monegatto |
author_facet |
Santoro, Daniel Monegatto |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4771205U9 |
dc.contributor.author.fl_str_mv |
Santoro, Daniel Monegatto |
dc.contributor.advisor1.fl_str_mv |
Nicoletti, Maria do Carmo |
dc.contributor.advisor1Lattes.fl_str_mv |
http://genos.cnpq.br:12010/dwlattes/owa/prc_imp_cv_int?f_cod=K4787728A5 |
contributor_str_mv |
Nicoletti, Maria do Carmo |
dc.subject.por.fl_str_mv |
Inteligência artificial Aprendizado do computador Métodos de busca Seleção de atributos |
topic |
Inteligência artificial Aprendizado do computador Métodos de busca Seleção de atributos CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
Inductive machine learning methods learn the expression of the concept from a training set. Training sets are, generally, composed by instances described by attributevalue pairs and an associated class. The attribute set used for describing the training instances has a strong impact on the induced concepts. In a machine learning environment, attribute subset selection techniques aim at the identification of the attributes which effectively contribute for establishing the class of an instance. These techniques can be characterized as wrappers (if they are associated with a specific machine learning method) or filter and many of them work in conjunction with a search method (there are also embedded feature selection methods, not very representative). This work approaches the attribute subset selection problem by investigating the performance of two families of wrappers the NN (Nearest Neighbor) and DistAl families and three filter families Relief, Focus and LVF. The many members of the NN family (as well as of the DistAl family) differ among themselves with relation to the search method they use. The work presents and discusses the experiments conducted in many knowledge domains and their results allow a comparative evaluation (as far as accuracy and dimensionality are concerned) among the members of the families. |
publishDate |
2005 |
dc.date.available.fl_str_mv |
2005-06-03 2016-06-02T19:06:20Z |
dc.date.issued.fl_str_mv |
2005-04-28 |
dc.date.accessioned.fl_str_mv |
2016-06-02T19:06:20Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SANTORO, Daniel Monegatto. Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.. 2005. 153 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/594 |
identifier_str_mv |
SANTORO, Daniel Monegatto. Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.. 2005. 153 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005. |
url |
https://repositorio.ufscar.br/handle/ufscar/594 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
dc.publisher.initials.fl_str_mv |
UFSCar |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/594/1/DissDMS.pdf https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/594/2/DissDMS.pdf.jpg |
bitstream.checksum.fl_str_mv |
520f8924dcc0b2471665008a2ea3ec5a 9d1137ef3f18724c411c8a66cf713283 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1777472017118789632 |