Seleção de modelos de classificação através de heurísticas.

Detalhes bibliográficos
Autor(a) principal: SANTOS, David Moises Barreto dos.
Data de Publicação: 2005
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903
Resumo: O processo de indução automática de modelos de classificação é composto de três etapas principais, pela ordem: amostragem, fragmentação e classificação. Devido à diversidade de técnicas que podem ser utilizadas em cada uma destas etapas, os resultados são muito instáveis — não existe a melhor técnica de amostragem, ou de fragmentação, etc. Para resolver o problema da indução do melhor modelo de classificação dentro de um espaço de busca, uma alternativa é arranjar todas as técnicas de amostragem, fragmentação e classificação disponíveis e buscar exaustivamente o melhor modelo de classificação. Entretanto, isto implicará em um alto custo computacional. Neste trabalho, descrevemos como foi possível descobrir heurísticas que podem ajudar a reduzir substancialmente o espaço de busca do melhor modelo de classificação. Também, discutimos o projeto e a implementação de um "framework" baseado nas heurísticas descobertas, objetivando guiar o minerador a escolher um modelo de classificação que satisfaça seus requisitos de qualidade, traduzidos em acurácia do modelo de classificação induzido, a um custo de processamento aceitável.
id UFCG_7dc0c2a200cf84a8a2ea85fdacb2e93a
oai_identifier_str oai:localhost:riufcg/2903
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str 4851
spelling SAMPAIO, Marcus Costa.SAMPAIO, M. C.http://lattes.cnpq.br/7407058401863661GOMES, Herman Martins.GOMES, H. M.http://lattes.cnpq.br/4223020694433271RUIZ, Duncan Dubugras Alcoba.RUIZ, Duncan D.http://lattes.cnpq.br/8250832800932125SANTOS, David Moises Barreto dos.http://lattes.cnpq.br/5904935830618045SANTOS, David Moises Barreto dos.O processo de indução automática de modelos de classificação é composto de três etapas principais, pela ordem: amostragem, fragmentação e classificação. Devido à diversidade de técnicas que podem ser utilizadas em cada uma destas etapas, os resultados são muito instáveis — não existe a melhor técnica de amostragem, ou de fragmentação, etc. Para resolver o problema da indução do melhor modelo de classificação dentro de um espaço de busca, uma alternativa é arranjar todas as técnicas de amostragem, fragmentação e classificação disponíveis e buscar exaustivamente o melhor modelo de classificação. Entretanto, isto implicará em um alto custo computacional. Neste trabalho, descrevemos como foi possível descobrir heurísticas que podem ajudar a reduzir substancialmente o espaço de busca do melhor modelo de classificação. Também, discutimos o projeto e a implementação de um "framework" baseado nas heurísticas descobertas, objetivando guiar o minerador a escolher um modelo de classificação que satisfaça seus requisitos de qualidade, traduzidos em acurácia do modelo de classificação induzido, a um custo de processamento aceitável.The automated induction process of classification models is composed of the following steps: sampling, splitting and classification. Due to the diversity of techniques that may be used in each one of these steps, the results are much unstable — there is not the best sampling technique or the best splitting technique and so on. In order to solve the problem of inducing the best classification model within a search space, one way may arrange all available techniques for sampling, splitting and classification to search exhaustively the best classification model. However, this will imply in a high computational cost. In this work, we describe how to discover heuristics that help to reduce this computational cost. Also, we discuss the design and implementation of a framework that was developed based on the heuristics discovered in order to guide the miner in choosing a classification model which satisfies his or her quality requirements translated in the accuracy of the classification model induced with acceptable computational cost.Submitted by Severina Oliveira (severina.sueli@ufcg.edu.br) on 2019-02-22T16:46:05Z No. of bitstreams: 1 DAVID MOISES BARRETO DOS SANTOS-DISSERTAÇÃO-PPGI 2005.pdf: 9869559 bytes, checksum: beb25f04ba4757ff9245e008da383d8d (MD5)Made available in DSpace on 2019-02-22T16:46:05Z (GMT). No. of bitstreams: 1 DAVID MOISES BARRETO DOS SANTOS-DISSERTAÇÃO-PPGI 2005.pdf: 9869559 bytes, checksum: beb25f04ba4757ff9245e008da383d8d (MD5) Previous issue date: 2005-07-19Universidade Federal de Campina GrandePÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGBrasilCentro de Engenharia Elétrica e Informática - CEEICiência da ComputaçãoBancos de DadosMineração de DadosProcesso de Mineração de DadosHeurísticasDatabasesData MiningData Mining ProcessHeuristicsSeleção de modelos de classificação através de heurísticas.Selection of classification models through heuristics.2005-07-192019-02-22T16:46:05Z2019-02-222019-02-22T16:46:05Zhttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903SANTOS, David Moises Barreto dos. Seleção de modelos de classificação através de heurísticas. 2005. 97 f. Dissertação (Mestrado em Informática)– Programa de Pós-Graduação em Informática, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2005. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCGORIGINALDAVID MOISES BARRETO DOS SANTOS-DISSERTAÇÃO-PPGI 2005.pdfDAVID MOISES BARRETO DOS SANTOS-DISSERTAÇÃO-PPGI 2005.pdfapplication/pdf1177470http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/2903/3/DAVID+MOISES+BARRETO+DOS+SANTOS-DISSERTA%C3%87%C3%83O-PPGI+2005.pdfd73bdd06f7b7b7463950d4e247d3828aMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/2903/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52riufcg/29032022-03-23 11:08:08.465oai:localhost:riufcg/2903Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512024-07-01T09:58:22.619248Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.pt_BR.fl_str_mv Seleção de modelos de classificação através de heurísticas.
dc.title.alternative.pt_BR.fl_str_mv Selection of classification models through heuristics.
title Seleção de modelos de classificação através de heurísticas.
spellingShingle Seleção de modelos de classificação através de heurísticas.
SANTOS, David Moises Barreto dos.
Ciência da Computação
Bancos de Dados
Mineração de Dados
Processo de Mineração de Dados
Heurísticas
Databases
Data Mining
Data Mining Process
Heuristics
title_short Seleção de modelos de classificação através de heurísticas.
title_full Seleção de modelos de classificação através de heurísticas.
title_fullStr Seleção de modelos de classificação através de heurísticas.
title_full_unstemmed Seleção de modelos de classificação através de heurísticas.
title_sort Seleção de modelos de classificação através de heurísticas.
author SANTOS, David Moises Barreto dos.
author_facet SANTOS, David Moises Barreto dos.
author_role author
dc.contributor.advisor1.fl_str_mv SAMPAIO, Marcus Costa.
dc.contributor.advisor1ID.fl_str_mv SAMPAIO, M. C.
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/7407058401863661
dc.contributor.referee1.fl_str_mv GOMES, Herman Martins.
dc.contributor.referee1ID.fl_str_mv GOMES, H. M.
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/4223020694433271
dc.contributor.referee2.fl_str_mv RUIZ, Duncan Dubugras Alcoba.
dc.contributor.referee2ID.fl_str_mv RUIZ, Duncan D.
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/8250832800932125
dc.contributor.authorID.fl_str_mv SANTOS, David Moises Barreto dos.
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/5904935830618045
dc.contributor.author.fl_str_mv SANTOS, David Moises Barreto dos.
contributor_str_mv SAMPAIO, Marcus Costa.
GOMES, Herman Martins.
RUIZ, Duncan Dubugras Alcoba.
dc.subject.cnpq.fl_str_mv Ciência da Computação
topic Ciência da Computação
Bancos de Dados
Mineração de Dados
Processo de Mineração de Dados
Heurísticas
Databases
Data Mining
Data Mining Process
Heuristics
dc.subject.por.fl_str_mv Bancos de Dados
Mineração de Dados
Processo de Mineração de Dados
Heurísticas
Databases
Data Mining
Data Mining Process
Heuristics
description O processo de indução automática de modelos de classificação é composto de três etapas principais, pela ordem: amostragem, fragmentação e classificação. Devido à diversidade de técnicas que podem ser utilizadas em cada uma destas etapas, os resultados são muito instáveis — não existe a melhor técnica de amostragem, ou de fragmentação, etc. Para resolver o problema da indução do melhor modelo de classificação dentro de um espaço de busca, uma alternativa é arranjar todas as técnicas de amostragem, fragmentação e classificação disponíveis e buscar exaustivamente o melhor modelo de classificação. Entretanto, isto implicará em um alto custo computacional. Neste trabalho, descrevemos como foi possível descobrir heurísticas que podem ajudar a reduzir substancialmente o espaço de busca do melhor modelo de classificação. Também, discutimos o projeto e a implementação de um "framework" baseado nas heurísticas descobertas, objetivando guiar o minerador a escolher um modelo de classificação que satisfaça seus requisitos de qualidade, traduzidos em acurácia do modelo de classificação induzido, a um custo de processamento aceitável.
publishDate 2005
dc.date.issued.fl_str_mv 2005-07-19
dc.date.accessioned.fl_str_mv 2019-02-22T16:46:05Z
dc.date.available.fl_str_mv 2019-02-22
2019-02-22T16:46:05Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903
dc.identifier.citation.fl_str_mv SANTOS, David Moises Barreto dos. Seleção de modelos de classificação através de heurísticas. 2005. 97 f. Dissertação (Mestrado em Informática)– Programa de Pós-Graduação em Informática, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2005. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903
identifier_str_mv SANTOS, David Moises Barreto dos. Seleção de modelos de classificação através de heurísticas. 2005. 97 f. Dissertação (Mestrado em Informática)– Programa de Pós-Graduação em Informática, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2005. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
dc.publisher.program.fl_str_mv PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
dc.publisher.initials.fl_str_mv UFCG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Centro de Engenharia Elétrica e Informática - CEEI
publisher.none.fl_str_mv Universidade Federal de Campina Grande
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
bitstream.url.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/2903/3/DAVID+MOISES+BARRETO+DOS+SANTOS-DISSERTA%C3%87%C3%83O-PPGI+2005.pdf
http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/2903/2/license.txt
bitstream.checksum.fl_str_mv d73bdd06f7b7b7463950d4e247d3828a
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1803396539481063424