Intelligent system for associative pattern identification in data
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.5/16840 |
Resumo: | Mestrado em Gestão de Sistemas de Informação |
id |
RCAP_d1d480973d97051974bf94a7c29b9fab |
---|---|
oai_identifier_str |
oai:www.repository.utl.pt:10400.5/16840 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Intelligent system for associative pattern identification in dataData MininPythonMachine LearningRegressão Linear MúltiplaRegressão LogísticaExtração de Regras de AssociaçãoMultiple Linear RegressionLogistic RegressionAssociation Rule MiningMestrado em Gestão de Sistemas de InformaçãoOs resultados das ferramentas estatísticas são baseados em resultados numéricos onde a interpretação e compreensão do que está gerado passa pelo intérprete que está a analisar os resultados. Esta tarefa de compreensão é muitas vezes complicada por vários fatores sendo um dos quais o facto do intérprete não conseguir captar dos resultados o que é relevante para avaliar o modelo formulado, não conseguindo avalia-lo como válido ou não, o que poderá levar à utilização de modelos que podem ser descabidos e sem fundamento. Com esta ideia em consideração foi desenvolvido, em ambiente Linux, um pequeno sistema com técnicas de data mining de carácter associativo. Neste sistema é gerado um relatório por cada modelo, onde são analisados os fatores mais relevantes para a criação de modelos, guiando desta forma o intérprete a decidir validar e utilizar o modelo criado ou a rejeitá-lo. O objetivo deste trabalho passou pela aprendizagem da linguagem Python aplicado a dados, uma aprendizagem aprofundada sobre data mining, as técnicas e métodos existentes e uma verificação das ferramentas de machine learning, de modo a criar como produto final um sistema com algumas técnicas. Foi possível a realização do trabalho proposto com a criação do sistema. Foram formulados métodos para produzir um modelo de regressão linear múltipla, regressão logística, um modelo de correlação linear e um modelo de regras de associação. Para três modelos foram gerados métodos tendo por base bibliotecas e machine learning. Para as regras de associação foi criado um método de raiz baseado no algoritmo FP-Growth.For many people statistics is a difficult task to be done, where the output that is given from the analytic tools can be complicated to understand. With this idea it was investigated the possibility of creation of a system that provides the creation some models to the users where is provided some guidelines about the most important values to take care for each model. The goals of this project are the development of the knowledge about Data Mining, learn how to use Python to produce data analysis, verify the existent machine learning applied to data for Python and use some data mining techniques to create a small system for associative models. The system is capable to perform a Linear Regression, a Logistic Regression, a Correlation Coefficient and an Association Rule Mining algorithm. For each method is provided an output that contains the numerical results of the method and it was produce some guidelines with general ideas, assumptions of each method and it is interpreted the most important statistical values to facilitate the understanding of all the methods. The system was developed in Python. Three methods were created are based on machine learning algorithms. The association rule mining algorithm was created from the beginning. The association rule mining algorithm developed was FP-growth. The system was ready to run in Linux.Instituto Superior de Economia e GestãoReis, António Palma dosRepositório da Universidade de LisboaMarques, Nelson Sousa2019-07-16T00:30:12Z2018-102018-10-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.5/16840engMarques, Nelson Sousa (2018). "Intelligent system for associative pattern identification in data". Dissertação de Mestrado, Universidade de Lisboa. Instituto Superior de Economia e Gestão.info:eu-repo/semantics/embargoedAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-06T14:46:35Zoai:www.repository.utl.pt:10400.5/16840Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:02:11.793470Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Intelligent system for associative pattern identification in data |
title |
Intelligent system for associative pattern identification in data |
spellingShingle |
Intelligent system for associative pattern identification in data Marques, Nelson Sousa Data Minin Python Machine Learning Regressão Linear Múltipla Regressão Logística Extração de Regras de Associação Multiple Linear Regression Logistic Regression Association Rule Mining |
title_short |
Intelligent system for associative pattern identification in data |
title_full |
Intelligent system for associative pattern identification in data |
title_fullStr |
Intelligent system for associative pattern identification in data |
title_full_unstemmed |
Intelligent system for associative pattern identification in data |
title_sort |
Intelligent system for associative pattern identification in data |
author |
Marques, Nelson Sousa |
author_facet |
Marques, Nelson Sousa |
author_role |
author |
dc.contributor.none.fl_str_mv |
Reis, António Palma dos Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Marques, Nelson Sousa |
dc.subject.por.fl_str_mv |
Data Minin Python Machine Learning Regressão Linear Múltipla Regressão Logística Extração de Regras de Associação Multiple Linear Regression Logistic Regression Association Rule Mining |
topic |
Data Minin Python Machine Learning Regressão Linear Múltipla Regressão Logística Extração de Regras de Associação Multiple Linear Regression Logistic Regression Association Rule Mining |
description |
Mestrado em Gestão de Sistemas de Informação |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-10 2018-10-01T00:00:00Z 2019-07-16T00:30:12Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.5/16840 |
url |
http://hdl.handle.net/10400.5/16840 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
Marques, Nelson Sousa (2018). "Intelligent system for associative pattern identification in data". Dissertação de Mestrado, Universidade de Lisboa. Instituto Superior de Economia e Gestão. |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/embargoedAccess |
eu_rights_str_mv |
embargoedAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Instituto Superior de Economia e Gestão |
publisher.none.fl_str_mv |
Instituto Superior de Economia e Gestão |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799131111322812417 |