Intelligent system for associative pattern identification in data

Detalhes bibliográficos
Autor(a) principal: Marques, Nelson Sousa
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.5/16840
Resumo: Mestrado em Gestão de Sistemas de Informação
id RCAP_d1d480973d97051974bf94a7c29b9fab
oai_identifier_str oai:www.repository.utl.pt:10400.5/16840
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Intelligent system for associative pattern identification in dataData MininPythonMachine LearningRegressão Linear MúltiplaRegressão LogísticaExtração de Regras de AssociaçãoMultiple Linear RegressionLogistic RegressionAssociation Rule MiningMestrado em Gestão de Sistemas de InformaçãoOs resultados das ferramentas estatísticas são baseados em resultados numéricos onde a interpretação e compreensão do que está gerado passa pelo intérprete que está a analisar os resultados. Esta tarefa de compreensão é muitas vezes complicada por vários fatores sendo um dos quais o facto do intérprete não conseguir captar dos resultados o que é relevante para avaliar o modelo formulado, não conseguindo avalia-lo como válido ou não, o que poderá levar à utilização de modelos que podem ser descabidos e sem fundamento. Com esta ideia em consideração foi desenvolvido, em ambiente Linux, um pequeno sistema com técnicas de data mining de carácter associativo. Neste sistema é gerado um relatório por cada modelo, onde são analisados os fatores mais relevantes para a criação de modelos, guiando desta forma o intérprete a decidir validar e utilizar o modelo criado ou a rejeitá-lo. O objetivo deste trabalho passou pela aprendizagem da linguagem Python aplicado a dados, uma aprendizagem aprofundada sobre data mining, as técnicas e métodos existentes e uma verificação das ferramentas de machine learning, de modo a criar como produto final um sistema com algumas técnicas. Foi possível a realização do trabalho proposto com a criação do sistema. Foram formulados métodos para produzir um modelo de regressão linear múltipla, regressão logística, um modelo de correlação linear e um modelo de regras de associação. Para três modelos foram gerados métodos tendo por base bibliotecas e machine learning. Para as regras de associação foi criado um método de raiz baseado no algoritmo FP-Growth.For many people statistics is a difficult task to be done, where the output that is given from the analytic tools can be complicated to understand. With this idea it was investigated the possibility of creation of a system that provides the creation some models to the users where is provided some guidelines about the most important values to take care for each model. The goals of this project are the development of the knowledge about Data Mining, learn how to use Python to produce data analysis, verify the existent machine learning applied to data for Python and use some data mining techniques to create a small system for associative models. The system is capable to perform a Linear Regression, a Logistic Regression, a Correlation Coefficient and an Association Rule Mining algorithm. For each method is provided an output that contains the numerical results of the method and it was produce some guidelines with general ideas, assumptions of each method and it is interpreted the most important statistical values to facilitate the understanding of all the methods. The system was developed in Python. Three methods were created are based on machine learning algorithms. The association rule mining algorithm was created from the beginning. The association rule mining algorithm developed was FP-growth. The system was ready to run in Linux.Instituto Superior de Economia e GestãoReis, António Palma dosRepositório da Universidade de LisboaMarques, Nelson Sousa2019-07-16T00:30:12Z2018-102018-10-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.5/16840engMarques, Nelson Sousa (2018). "Intelligent system for associative pattern identification in data". Dissertação de Mestrado, Universidade de Lisboa. Instituto Superior de Economia e Gestão.info:eu-repo/semantics/embargoedAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-06T14:46:35Zoai:www.repository.utl.pt:10400.5/16840Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:02:11.793470Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Intelligent system for associative pattern identification in data
title Intelligent system for associative pattern identification in data
spellingShingle Intelligent system for associative pattern identification in data
Marques, Nelson Sousa
Data Minin
Python
Machine Learning
Regressão Linear Múltipla
Regressão Logística
Extração de Regras de Associação
Multiple Linear Regression
Logistic Regression
Association Rule Mining
title_short Intelligent system for associative pattern identification in data
title_full Intelligent system for associative pattern identification in data
title_fullStr Intelligent system for associative pattern identification in data
title_full_unstemmed Intelligent system for associative pattern identification in data
title_sort Intelligent system for associative pattern identification in data
author Marques, Nelson Sousa
author_facet Marques, Nelson Sousa
author_role author
dc.contributor.none.fl_str_mv Reis, António Palma dos
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Marques, Nelson Sousa
dc.subject.por.fl_str_mv Data Minin
Python
Machine Learning
Regressão Linear Múltipla
Regressão Logística
Extração de Regras de Associação
Multiple Linear Regression
Logistic Regression
Association Rule Mining
topic Data Minin
Python
Machine Learning
Regressão Linear Múltipla
Regressão Logística
Extração de Regras de Associação
Multiple Linear Regression
Logistic Regression
Association Rule Mining
description Mestrado em Gestão de Sistemas de Informação
publishDate 2018
dc.date.none.fl_str_mv 2018-10
2018-10-01T00:00:00Z
2019-07-16T00:30:12Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.5/16840
url http://hdl.handle.net/10400.5/16840
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv Marques, Nelson Sousa (2018). "Intelligent system for associative pattern identification in data". Dissertação de Mestrado, Universidade de Lisboa. Instituto Superior de Economia e Gestão.
dc.rights.driver.fl_str_mv info:eu-repo/semantics/embargoedAccess
eu_rights_str_mv embargoedAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Instituto Superior de Economia e Gestão
publisher.none.fl_str_mv Instituto Superior de Economia e Gestão
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799131111322812417