Seleção de modelos de classificação através de heurísticas.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2005 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFCG |
Texto Completo: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903 |
Resumo: | O processo de indução automática de modelos de classificação é composto de três etapas principais, pela ordem: amostragem, fragmentação e classificação. Devido à diversidade de técnicas que podem ser utilizadas em cada uma destas etapas, os resultados são muito instáveis — não existe a melhor técnica de amostragem, ou de fragmentação, etc. Para resolver o problema da indução do melhor modelo de classificação dentro de um espaço de busca, uma alternativa é arranjar todas as técnicas de amostragem, fragmentação e classificação disponíveis e buscar exaustivamente o melhor modelo de classificação. Entretanto, isto implicará em um alto custo computacional. Neste trabalho, descrevemos como foi possível descobrir heurísticas que podem ajudar a reduzir substancialmente o espaço de busca do melhor modelo de classificação. Também, discutimos o projeto e a implementação de um "framework" baseado nas heurísticas descobertas, objetivando guiar o minerador a escolher um modelo de classificação que satisfaça seus requisitos de qualidade, traduzidos em acurácia do modelo de classificação induzido, a um custo de processamento aceitável. |
id |
UFCG_7dc0c2a200cf84a8a2ea85fdacb2e93a |
---|---|
oai_identifier_str |
oai:localhost:riufcg/2903 |
network_acronym_str |
UFCG |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository_id_str |
4851 |
spelling |
SAMPAIO, Marcus Costa.SAMPAIO, M. C.http://lattes.cnpq.br/7407058401863661GOMES, Herman Martins.GOMES, H. M.http://lattes.cnpq.br/4223020694433271RUIZ, Duncan Dubugras Alcoba.RUIZ, Duncan D.http://lattes.cnpq.br/8250832800932125SANTOS, David Moises Barreto dos.http://lattes.cnpq.br/5904935830618045SANTOS, David Moises Barreto dos.O processo de indução automática de modelos de classificação é composto de três etapas principais, pela ordem: amostragem, fragmentação e classificação. Devido à diversidade de técnicas que podem ser utilizadas em cada uma destas etapas, os resultados são muito instáveis — não existe a melhor técnica de amostragem, ou de fragmentação, etc. Para resolver o problema da indução do melhor modelo de classificação dentro de um espaço de busca, uma alternativa é arranjar todas as técnicas de amostragem, fragmentação e classificação disponíveis e buscar exaustivamente o melhor modelo de classificação. Entretanto, isto implicará em um alto custo computacional. Neste trabalho, descrevemos como foi possível descobrir heurísticas que podem ajudar a reduzir substancialmente o espaço de busca do melhor modelo de classificação. Também, discutimos o projeto e a implementação de um "framework" baseado nas heurísticas descobertas, objetivando guiar o minerador a escolher um modelo de classificação que satisfaça seus requisitos de qualidade, traduzidos em acurácia do modelo de classificação induzido, a um custo de processamento aceitável.The automated induction process of classification models is composed of the following steps: sampling, splitting and classification. Due to the diversity of techniques that may be used in each one of these steps, the results are much unstable — there is not the best sampling technique or the best splitting technique and so on. In order to solve the problem of inducing the best classification model within a search space, one way may arrange all available techniques for sampling, splitting and classification to search exhaustively the best classification model. However, this will imply in a high computational cost. In this work, we describe how to discover heuristics that help to reduce this computational cost. Also, we discuss the design and implementation of a framework that was developed based on the heuristics discovered in order to guide the miner in choosing a classification model which satisfies his or her quality requirements translated in the accuracy of the classification model induced with acceptable computational cost.Submitted by Severina Oliveira (severina.sueli@ufcg.edu.br) on 2019-02-22T16:46:05Z No. of bitstreams: 1 DAVID MOISES BARRETO DOS SANTOS-DISSERTAÇÃO-PPGI 2005.pdf: 9869559 bytes, checksum: beb25f04ba4757ff9245e008da383d8d (MD5)Made available in DSpace on 2019-02-22T16:46:05Z (GMT). No. of bitstreams: 1 DAVID MOISES BARRETO DOS SANTOS-DISSERTAÇÃO-PPGI 2005.pdf: 9869559 bytes, checksum: beb25f04ba4757ff9245e008da383d8d (MD5) Previous issue date: 2005-07-19Universidade Federal de Campina GrandePÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGBrasilCentro de Engenharia Elétrica e Informática - CEEICiência da ComputaçãoBancos de DadosMineração de DadosProcesso de Mineração de DadosHeurísticasDatabasesData MiningData Mining ProcessHeuristicsSeleção de modelos de classificação através de heurísticas.Selection of classification models through heuristics.2005-07-192019-02-22T16:46:05Z2019-02-222019-02-22T16:46:05Zhttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903SANTOS, David Moises Barreto dos. Seleção de modelos de classificação através de heurísticas. 2005. 97 f. Dissertação (Mestrado em Informática)– Programa de Pós-Graduação em Informática, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2005. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCGORIGINALDAVID MOISES BARRETO DOS SANTOS-DISSERTAÇÃO-PPGI 2005.pdfDAVID MOISES BARRETO DOS SANTOS-DISSERTAÇÃO-PPGI 2005.pdfapplication/pdf1177470http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/2903/3/DAVID+MOISES+BARRETO+DOS+SANTOS-DISSERTA%C3%87%C3%83O-PPGI+2005.pdfd73bdd06f7b7b7463950d4e247d3828aMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/2903/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52riufcg/29032022-03-23 11:08:08.465oai:localhost:riufcg/2903Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512024-07-01T09:58:22.619248Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false |
dc.title.pt_BR.fl_str_mv |
Seleção de modelos de classificação através de heurísticas. |
dc.title.alternative.pt_BR.fl_str_mv |
Selection of classification models through heuristics. |
title |
Seleção de modelos de classificação através de heurísticas. |
spellingShingle |
Seleção de modelos de classificação através de heurísticas. SANTOS, David Moises Barreto dos. Ciência da Computação Bancos de Dados Mineração de Dados Processo de Mineração de Dados Heurísticas Databases Data Mining Data Mining Process Heuristics |
title_short |
Seleção de modelos de classificação através de heurísticas. |
title_full |
Seleção de modelos de classificação através de heurísticas. |
title_fullStr |
Seleção de modelos de classificação através de heurísticas. |
title_full_unstemmed |
Seleção de modelos de classificação através de heurísticas. |
title_sort |
Seleção de modelos de classificação através de heurísticas. |
author |
SANTOS, David Moises Barreto dos. |
author_facet |
SANTOS, David Moises Barreto dos. |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
SAMPAIO, Marcus Costa. |
dc.contributor.advisor1ID.fl_str_mv |
SAMPAIO, M. C. |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/7407058401863661 |
dc.contributor.referee1.fl_str_mv |
GOMES, Herman Martins. |
dc.contributor.referee1ID.fl_str_mv |
GOMES, H. M. |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/4223020694433271 |
dc.contributor.referee2.fl_str_mv |
RUIZ, Duncan Dubugras Alcoba. |
dc.contributor.referee2ID.fl_str_mv |
RUIZ, Duncan D. |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/8250832800932125 |
dc.contributor.authorID.fl_str_mv |
SANTOS, David Moises Barreto dos. |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/5904935830618045 |
dc.contributor.author.fl_str_mv |
SANTOS, David Moises Barreto dos. |
contributor_str_mv |
SAMPAIO, Marcus Costa. GOMES, Herman Martins. RUIZ, Duncan Dubugras Alcoba. |
dc.subject.cnpq.fl_str_mv |
Ciência da Computação |
topic |
Ciência da Computação Bancos de Dados Mineração de Dados Processo de Mineração de Dados Heurísticas Databases Data Mining Data Mining Process Heuristics |
dc.subject.por.fl_str_mv |
Bancos de Dados Mineração de Dados Processo de Mineração de Dados Heurísticas Databases Data Mining Data Mining Process Heuristics |
description |
O processo de indução automática de modelos de classificação é composto de três etapas principais, pela ordem: amostragem, fragmentação e classificação. Devido à diversidade de técnicas que podem ser utilizadas em cada uma destas etapas, os resultados são muito instáveis — não existe a melhor técnica de amostragem, ou de fragmentação, etc. Para resolver o problema da indução do melhor modelo de classificação dentro de um espaço de busca, uma alternativa é arranjar todas as técnicas de amostragem, fragmentação e classificação disponíveis e buscar exaustivamente o melhor modelo de classificação. Entretanto, isto implicará em um alto custo computacional. Neste trabalho, descrevemos como foi possível descobrir heurísticas que podem ajudar a reduzir substancialmente o espaço de busca do melhor modelo de classificação. Também, discutimos o projeto e a implementação de um "framework" baseado nas heurísticas descobertas, objetivando guiar o minerador a escolher um modelo de classificação que satisfaça seus requisitos de qualidade, traduzidos em acurácia do modelo de classificação induzido, a um custo de processamento aceitável. |
publishDate |
2005 |
dc.date.issued.fl_str_mv |
2005-07-19 |
dc.date.accessioned.fl_str_mv |
2019-02-22T16:46:05Z |
dc.date.available.fl_str_mv |
2019-02-22 2019-02-22T16:46:05Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903 |
dc.identifier.citation.fl_str_mv |
SANTOS, David Moises Barreto dos. Seleção de modelos de classificação através de heurísticas. 2005. 97 f. Dissertação (Mestrado em Informática)– Programa de Pós-Graduação em Informática, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2005. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903 |
url |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903 |
identifier_str_mv |
SANTOS, David Moises Barreto dos. Seleção de modelos de classificação através de heurísticas. 2005. 97 f. Dissertação (Mestrado em Informática)– Programa de Pós-Graduação em Informática, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2005. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Campina Grande |
dc.publisher.program.fl_str_mv |
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO |
dc.publisher.initials.fl_str_mv |
UFCG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Centro de Engenharia Elétrica e Informática - CEEI |
publisher.none.fl_str_mv |
Universidade Federal de Campina Grande |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG |
instname_str |
Universidade Federal de Campina Grande (UFCG) |
instacron_str |
UFCG |
institution |
UFCG |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
collection |
Biblioteca Digital de Teses e Dissertações da UFCG |
bitstream.url.fl_str_mv |
http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/2903/3/DAVID+MOISES+BARRETO+DOS+SANTOS-DISSERTA%C3%87%C3%83O-PPGI+2005.pdf http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/2903/2/license.txt |
bitstream.checksum.fl_str_mv |
d73bdd06f7b7b7463950d4e247d3828a 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG) |
repository.mail.fl_str_mv |
bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br |
_version_ |
1803396539481063424 |