Estudo e construção de árvores de decisão: aplicação ao ensino

Detalhes bibliográficos
Autor(a) principal: Suquina, Paulina Da Silva Orlando
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/1822/65481
Resumo: Dissertação de mestrado em Matemática e Computação
id RCAP_184f2963b36025a4d064c3b813759294
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/65481
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Estudo e construção de árvores de decisão: aplicação ao ensinoÁrvore de decisãoPodaPré-podaClassificaçãoMatriz de ConfusãoDecision treePruningPre-pruningClassificationConfusion matricesCiências Naturais::MatemáticasDissertação de mestrado em Matemática e ComputaçãoAs árvores de decisão são ferramentas muito utilizadas em áreas como as de Extração de Conhecimento de Dados (ECD), devido à eficiência que elas possuem em produzir classificadores. As mesmas são vantajosas devido à sua capacidade em dividir um espaço de exemplos em subespaços, e ajustar cada subespaço recorrendo a diferentes modelos de classificação. Este trabalho pretende fazer um estudo relativamente à construção de árvores de decisão utilizando diferentes técnicas de pré-poda, que têm como finalidade melhorar a qualidade de um classificador. Assim, com a utilização de uma Base de Dados (BD) real ligada à área do ensino, referente a escola secundaria Conde de Monsaraz, à qual pertence ao agrupamento vertical de Escolas de Reguengos de Monsaraz, são feitas várias experiências com diferentes critérios de paragem, obtendo como resultado duas Matrizes de Confusão (MC) referentes aos dados de treino e de teste. Assim, a utilização de indicadores como o Recall e a Especificity, que são adequados ao problema em causa, possibilitam a quantificação do erro do classificador. No final das experiências obtém-se um gráfico que corresponde ao valor do indicador vs o critério de paragem utilizado. Desta forma, o resultado deste gráfico são duas curvas, uma associada aos dados de treino e outra associada aos dados de teste.Decision trees are widely used as inference tools in areas such as Data Extraction, due to their efficiency in producing classifiers. Their ability to partition the attribute space into subspaces labeled with class values. This work aims at studing the construction of decision trees using different pruning techniques to improve the quality and the efficiency of a classifier. We shall apply the methodology to real Databases connected to the teaching area, namely the secondary school Conde de Monsaraz. Several experiments were carried out with different stopping criteria, to provide two Confusion Matrices (for the training and test dataset) that enable the accuracy of the method. More specifically, indicators such as Recall and Especificity are appropriate to our real problem for quantifying the classifier error. At the end of the experiments, a figure displays the correspondance of the indicator vs. the stopping criterion threshold and provide two curves that give a prediction of the most effective decision tree.Clain, StéphaneUniversidade do MinhoSuquina, Paulina Da Silva Orlando20192019-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/65481por202472230info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T11:56:04Zoai:repositorium.sdum.uminho.pt:1822/65481Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:45:39.801877Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Estudo e construção de árvores de decisão: aplicação ao ensino
title Estudo e construção de árvores de decisão: aplicação ao ensino
spellingShingle Estudo e construção de árvores de decisão: aplicação ao ensino
Suquina, Paulina Da Silva Orlando
Árvore de decisão
Poda
Pré-poda
Classificação
Matriz de Confusão
Decision tree
Pruning
Pre-pruning
Classification
Confusion matrices
Ciências Naturais::Matemáticas
title_short Estudo e construção de árvores de decisão: aplicação ao ensino
title_full Estudo e construção de árvores de decisão: aplicação ao ensino
title_fullStr Estudo e construção de árvores de decisão: aplicação ao ensino
title_full_unstemmed Estudo e construção de árvores de decisão: aplicação ao ensino
title_sort Estudo e construção de árvores de decisão: aplicação ao ensino
author Suquina, Paulina Da Silva Orlando
author_facet Suquina, Paulina Da Silva Orlando
author_role author
dc.contributor.none.fl_str_mv Clain, Stéphane
Universidade do Minho
dc.contributor.author.fl_str_mv Suquina, Paulina Da Silva Orlando
dc.subject.por.fl_str_mv Árvore de decisão
Poda
Pré-poda
Classificação
Matriz de Confusão
Decision tree
Pruning
Pre-pruning
Classification
Confusion matrices
Ciências Naturais::Matemáticas
topic Árvore de decisão
Poda
Pré-poda
Classificação
Matriz de Confusão
Decision tree
Pruning
Pre-pruning
Classification
Confusion matrices
Ciências Naturais::Matemáticas
description Dissertação de mestrado em Matemática e Computação
publishDate 2019
dc.date.none.fl_str_mv 2019
2019-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/65481
url http://hdl.handle.net/1822/65481
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 202472230
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132209177690112