Estudo e construção de árvores de decisão: aplicação ao ensino
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/1822/65481 |
Resumo: | Dissertação de mestrado em Matemática e Computação |
id |
RCAP_184f2963b36025a4d064c3b813759294 |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/65481 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Estudo e construção de árvores de decisão: aplicação ao ensinoÁrvore de decisãoPodaPré-podaClassificaçãoMatriz de ConfusãoDecision treePruningPre-pruningClassificationConfusion matricesCiências Naturais::MatemáticasDissertação de mestrado em Matemática e ComputaçãoAs árvores de decisão são ferramentas muito utilizadas em áreas como as de Extração de Conhecimento de Dados (ECD), devido à eficiência que elas possuem em produzir classificadores. As mesmas são vantajosas devido à sua capacidade em dividir um espaço de exemplos em subespaços, e ajustar cada subespaço recorrendo a diferentes modelos de classificação. Este trabalho pretende fazer um estudo relativamente à construção de árvores de decisão utilizando diferentes técnicas de pré-poda, que têm como finalidade melhorar a qualidade de um classificador. Assim, com a utilização de uma Base de Dados (BD) real ligada à área do ensino, referente a escola secundaria Conde de Monsaraz, à qual pertence ao agrupamento vertical de Escolas de Reguengos de Monsaraz, são feitas várias experiências com diferentes critérios de paragem, obtendo como resultado duas Matrizes de Confusão (MC) referentes aos dados de treino e de teste. Assim, a utilização de indicadores como o Recall e a Especificity, que são adequados ao problema em causa, possibilitam a quantificação do erro do classificador. No final das experiências obtém-se um gráfico que corresponde ao valor do indicador vs o critério de paragem utilizado. Desta forma, o resultado deste gráfico são duas curvas, uma associada aos dados de treino e outra associada aos dados de teste.Decision trees are widely used as inference tools in areas such as Data Extraction, due to their efficiency in producing classifiers. Their ability to partition the attribute space into subspaces labeled with class values. This work aims at studing the construction of decision trees using different pruning techniques to improve the quality and the efficiency of a classifier. We shall apply the methodology to real Databases connected to the teaching area, namely the secondary school Conde de Monsaraz. Several experiments were carried out with different stopping criteria, to provide two Confusion Matrices (for the training and test dataset) that enable the accuracy of the method. More specifically, indicators such as Recall and Especificity are appropriate to our real problem for quantifying the classifier error. At the end of the experiments, a figure displays the correspondance of the indicator vs. the stopping criterion threshold and provide two curves that give a prediction of the most effective decision tree.Clain, StéphaneUniversidade do MinhoSuquina, Paulina Da Silva Orlando20192019-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/65481por202472230info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T11:56:04Zoai:repositorium.sdum.uminho.pt:1822/65481Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:45:39.801877Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Estudo e construção de árvores de decisão: aplicação ao ensino |
title |
Estudo e construção de árvores de decisão: aplicação ao ensino |
spellingShingle |
Estudo e construção de árvores de decisão: aplicação ao ensino Suquina, Paulina Da Silva Orlando Árvore de decisão Poda Pré-poda Classificação Matriz de Confusão Decision tree Pruning Pre-pruning Classification Confusion matrices Ciências Naturais::Matemáticas |
title_short |
Estudo e construção de árvores de decisão: aplicação ao ensino |
title_full |
Estudo e construção de árvores de decisão: aplicação ao ensino |
title_fullStr |
Estudo e construção de árvores de decisão: aplicação ao ensino |
title_full_unstemmed |
Estudo e construção de árvores de decisão: aplicação ao ensino |
title_sort |
Estudo e construção de árvores de decisão: aplicação ao ensino |
author |
Suquina, Paulina Da Silva Orlando |
author_facet |
Suquina, Paulina Da Silva Orlando |
author_role |
author |
dc.contributor.none.fl_str_mv |
Clain, Stéphane Universidade do Minho |
dc.contributor.author.fl_str_mv |
Suquina, Paulina Da Silva Orlando |
dc.subject.por.fl_str_mv |
Árvore de decisão Poda Pré-poda Classificação Matriz de Confusão Decision tree Pruning Pre-pruning Classification Confusion matrices Ciências Naturais::Matemáticas |
topic |
Árvore de decisão Poda Pré-poda Classificação Matriz de Confusão Decision tree Pruning Pre-pruning Classification Confusion matrices Ciências Naturais::Matemáticas |
description |
Dissertação de mestrado em Matemática e Computação |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019 2019-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1822/65481 |
url |
http://hdl.handle.net/1822/65481 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
202472230 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799132209177690112 |