Avaliação de desempenho da análise de componentes principais e análise de componente principal logística, aplicadas a dados educacionais

Detalhes bibliográficos
Autor(a) principal: Maia, Marília Magalhães
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU)
Texto Completo: https://repositorio.ufersa.edu.br/handle/prefix/10022
Resumo: Quando se lida com grandes conjuntos de dados, um dos processos necessários a serem aplicados é o da seleção, do qual destaca-se a Análise de Componente Principal (PCA, do inglês Principal Component Analysis), como a mais conhecida técnica de redução da dimensionalidade. A técnica consiste na criação de um novo conjunto de dados com variáveis originadas a partir de uma transformação linear das variáveis dos dados originais. Entretanto, visando o aumento da eficiência da técnica sobre específicos tipos de dados, desenvolveram-se extensões do método, sendo a Análise de Componente Principal Logística (LPCA, do inglês Logistic Principal Component Analysis) a indicada para aplicações sobre dados binários. Dessa forma, o presente trabalho consiste em comparar o desempenho na redução da dimensionalidade de ambas as técnicas, sobre conjuntos de dados com valores entre 0 e 1, identificando que para esse tipo de dados o algoritmo LPCA não consegue superar a redução encontrada com implementação do PCA. Como exemplo de teste, foram usados um conjunto de dados relacionados ao Exame Nacional do Ensino Médio (ENEM) e a aplicação dos métodos sobre eles permite que sejam identificadas habilidades essenciais a serem desenvolvidas pelos alunos para a possível melhoria de desempenho no exame.
id UFER_b6c7a50ac60203d61e09e0244e70a685
oai_identifier_str oai:repositorio.ufersa.edu.br:prefix/10022
network_acronym_str UFER
network_name_str Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU)
repository_id_str
spelling Avaliação de desempenho da análise de componentes principais e análise de componente principal logística, aplicadas a dados educacionaisENGENHARIAS::ENGENHARIA ELETRICARedução de dimensionalidadeAnálise de componente principalAnálise de componente principal logísticaDesempenhoQuando se lida com grandes conjuntos de dados, um dos processos necessários a serem aplicados é o da seleção, do qual destaca-se a Análise de Componente Principal (PCA, do inglês Principal Component Analysis), como a mais conhecida técnica de redução da dimensionalidade. A técnica consiste na criação de um novo conjunto de dados com variáveis originadas a partir de uma transformação linear das variáveis dos dados originais. Entretanto, visando o aumento da eficiência da técnica sobre específicos tipos de dados, desenvolveram-se extensões do método, sendo a Análise de Componente Principal Logística (LPCA, do inglês Logistic Principal Component Analysis) a indicada para aplicações sobre dados binários. Dessa forma, o presente trabalho consiste em comparar o desempenho na redução da dimensionalidade de ambas as técnicas, sobre conjuntos de dados com valores entre 0 e 1, identificando que para esse tipo de dados o algoritmo LPCA não consegue superar a redução encontrada com implementação do PCA. Como exemplo de teste, foram usados um conjunto de dados relacionados ao Exame Nacional do Ensino Médio (ENEM) e a aplicação dos métodos sobre eles permite que sejam identificadas habilidades essenciais a serem desenvolvidas pelos alunos para a possível melhoria de desempenho no exame.When dealing with large datasets, one necessary process is selection, with Principal Component Analysis (PCA) standing out as the most well-known technique for dimensionality reduction. This technique involves creating a new dataset with variables derived from a linear transformation of the original data's variables. However, to enhance performance on specific types of datasets, extensions of the method have been developed, with Logistic Principal Component Analysis (LPCA) being recommended for applications involving binary data. Therefore, this study aims to compare the performance in dimensionality reduction of both techniques on datasets with values ranging between 0 and 1. Indeed, this research reveals a notably enhanced performance in dimensionality reduction through the implementation of LPCA, even when applied to a non-binary dataset. To achieve this, a dataset associated with the National High School Exam (ENEM) was utilized. The application of these methods to the ENEM dataset facilitates the identification of fundamental skills that students should cultivate to potentially enhance their performance in the exam.12 f.Centro de Engenharias - CEBrasilUFERSAUniversidade Federal Rural do Semi-ÁridoAndrade, Luiza Helena Felix deFernandes, SilvioAndrade, Luiza Helena Felix deAraújo, Silvio Roberto Fernandes deBérgamo, Genevile CarifeMaia, Marília Magalhães2024-01-10T15:33:59Z2024-01-10T15:33:59Z2023-10-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesispdfapplication/pdfMAIA, Marília Magalhães. Avaliação de desempenho da análise de componentes principais e análise de componente principal logística, aplicadas a dados educacionais. 2023. 12 f. TCC (Graduação) - Curso de Engenharia Elétrica, Centro de Engenharias - CE, Universidade Federal Rural do Semi-Árido - UFERSA, Mossoró/RN, 2023.https://repositorio.ufersa.edu.br/handle/prefix/10022MossoróAttribution-ShareAlike 3.0 BrazilUFERSAhttp://creativecommons.org/licenses/by-sa/3.0/br/info:eu-repo/semantics/openAccessporreponame:Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU)instname:Universidade Federal Rural do Semi-Árido (UFERSA)instacron:UFERSA2024-01-10T23:33:59Zoai:repositorio.ufersa.edu.br:prefix/10022Repositório Institucionalhttps://repositorio.ufersa.edu.br/PUBhttps://repositorio.ufersa.edu.br/server/oai/requestrepositorio@ufersa.edu.br || admrepositorio@ufersa.edu.bropendoar:2024-01-10T23:33:59Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU) - Universidade Federal Rural do Semi-Árido (UFERSA)false
dc.title.none.fl_str_mv Avaliação de desempenho da análise de componentes principais e análise de componente principal logística, aplicadas a dados educacionais
title Avaliação de desempenho da análise de componentes principais e análise de componente principal logística, aplicadas a dados educacionais
spellingShingle Avaliação de desempenho da análise de componentes principais e análise de componente principal logística, aplicadas a dados educacionais
Maia, Marília Magalhães
ENGENHARIAS::ENGENHARIA ELETRICA
Redução de dimensionalidade
Análise de componente principal
Análise de componente principal logística
Desempenho
title_short Avaliação de desempenho da análise de componentes principais e análise de componente principal logística, aplicadas a dados educacionais
title_full Avaliação de desempenho da análise de componentes principais e análise de componente principal logística, aplicadas a dados educacionais
title_fullStr Avaliação de desempenho da análise de componentes principais e análise de componente principal logística, aplicadas a dados educacionais
title_full_unstemmed Avaliação de desempenho da análise de componentes principais e análise de componente principal logística, aplicadas a dados educacionais
title_sort Avaliação de desempenho da análise de componentes principais e análise de componente principal logística, aplicadas a dados educacionais
author Maia, Marília Magalhães
author_facet Maia, Marília Magalhães
author_role author
dc.contributor.none.fl_str_mv Andrade, Luiza Helena Felix de
Fernandes, Silvio
Andrade, Luiza Helena Felix de
Araújo, Silvio Roberto Fernandes de
Bérgamo, Genevile Carife
dc.contributor.author.fl_str_mv Maia, Marília Magalhães
dc.subject.por.fl_str_mv ENGENHARIAS::ENGENHARIA ELETRICA
Redução de dimensionalidade
Análise de componente principal
Análise de componente principal logística
Desempenho
topic ENGENHARIAS::ENGENHARIA ELETRICA
Redução de dimensionalidade
Análise de componente principal
Análise de componente principal logística
Desempenho
description Quando se lida com grandes conjuntos de dados, um dos processos necessários a serem aplicados é o da seleção, do qual destaca-se a Análise de Componente Principal (PCA, do inglês Principal Component Analysis), como a mais conhecida técnica de redução da dimensionalidade. A técnica consiste na criação de um novo conjunto de dados com variáveis originadas a partir de uma transformação linear das variáveis dos dados originais. Entretanto, visando o aumento da eficiência da técnica sobre específicos tipos de dados, desenvolveram-se extensões do método, sendo a Análise de Componente Principal Logística (LPCA, do inglês Logistic Principal Component Analysis) a indicada para aplicações sobre dados binários. Dessa forma, o presente trabalho consiste em comparar o desempenho na redução da dimensionalidade de ambas as técnicas, sobre conjuntos de dados com valores entre 0 e 1, identificando que para esse tipo de dados o algoritmo LPCA não consegue superar a redução encontrada com implementação do PCA. Como exemplo de teste, foram usados um conjunto de dados relacionados ao Exame Nacional do Ensino Médio (ENEM) e a aplicação dos métodos sobre eles permite que sejam identificadas habilidades essenciais a serem desenvolvidas pelos alunos para a possível melhoria de desempenho no exame.
publishDate 2023
dc.date.none.fl_str_mv 2023-10-11
2024-01-10T15:33:59Z
2024-01-10T15:33:59Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv MAIA, Marília Magalhães. Avaliação de desempenho da análise de componentes principais e análise de componente principal logística, aplicadas a dados educacionais. 2023. 12 f. TCC (Graduação) - Curso de Engenharia Elétrica, Centro de Engenharias - CE, Universidade Federal Rural do Semi-Árido - UFERSA, Mossoró/RN, 2023.
https://repositorio.ufersa.edu.br/handle/prefix/10022
identifier_str_mv MAIA, Marília Magalhães. Avaliação de desempenho da análise de componentes principais e análise de componente principal logística, aplicadas a dados educacionais. 2023. 12 f. TCC (Graduação) - Curso de Engenharia Elétrica, Centro de Engenharias - CE, Universidade Federal Rural do Semi-Árido - UFERSA, Mossoró/RN, 2023.
url https://repositorio.ufersa.edu.br/handle/prefix/10022
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-ShareAlike 3.0 Brazil
UFERSA
http://creativecommons.org/licenses/by-sa/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-ShareAlike 3.0 Brazil
UFERSA
http://creativecommons.org/licenses/by-sa/3.0/br/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv pdf
application/pdf
dc.coverage.none.fl_str_mv Mossoró
dc.publisher.none.fl_str_mv Centro de Engenharias - CE
Brasil
UFERSA
Universidade Federal Rural do Semi-Árido
publisher.none.fl_str_mv Centro de Engenharias - CE
Brasil
UFERSA
Universidade Federal Rural do Semi-Árido
dc.source.none.fl_str_mv reponame:Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU)
instname:Universidade Federal Rural do Semi-Árido (UFERSA)
instacron:UFERSA
instname_str Universidade Federal Rural do Semi-Árido (UFERSA)
instacron_str UFERSA
institution UFERSA
reponame_str Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU)
collection Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU)
repository.name.fl_str_mv Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU) - Universidade Federal Rural do Semi-Árido (UFERSA)
repository.mail.fl_str_mv repositorio@ufersa.edu.br || admrepositorio@ufersa.edu.br
_version_ 1809747446041935872