Benchmarking de técnicas de Bussiness Analytics em Big Data

Detalhes bibliográficos
Autor(a) principal: Oliveira, Cátia Cristina Pereira
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/1822/76442
Resumo: Dissertação de mestrado em Engenharia e Gestão de Sistemas de Informação
id RCAP_5088d5ae803236cd98fa9f446127b4d2
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/76442
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Benchmarking de técnicas de Bussiness Analytics em Big DataBenchmarkingTécnicasBusiness analyticsBig dataTechniquesBusiness analyticsEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado em Engenharia e Gestão de Sistemas de InformaçãoOs desenvolvimentos tecnológicos e a crescente dependência das organizações e da sociedade no mundo da internet levaram ao crescimento e variedade de dados. Esse crescimento e variedade, tornaram-se num desafio para os manipuladores de dados, uma vez que o processamento de uma grande quantidade de dados pode ser um desafio, porque pode despender muito tempo. Assim, veio a criação do conceito Big Data. Big Data pode ser entendido como um grande conjunto de dados com várias estruturas, que a tecnologia tradicional não consegue lidar, tendo dificuldade de armazenamento e de processamento. Nesta dissertação, serão definidos dois conceitos. Portanto, esta dissertação foca nos desafios que o Big Data coloca ao Data Mining, Nesta dissertação foi analisado um estudo de seleção de ferramentas de Data Mining, onde foram utilizadas duas metodologias tendo em consideração vários critérios de avaliação. Posteriormente, com base nos resultados do estudo anterior, foram selecionadas as duas melhores ferramentas, KNIME e RapidMiner. Nesta dissertação também são apresentadas algumas sugestões de boas práticas quando lidamos com dados. Depois de selecionadas as ferramentas, foi analisado um estudo referente à performance das ferramentas KNIME e RapidMiner em ambiente Big Data. No inicio deste documento é apresentado um enquadramento do projeto e qual o seu objetivo. De seguida, é apresentado a revisão de literatura onde são descritos os principais conceitos e tópicos relacionados com a dissertação. Posteriormente, são apresentadas as abordagens metodológicas utilizadas nesta dissertação, assim como de que forma foram utilizadas. De seguida, são apresentados os desafios de Big Data Mining. Seguidamente, é apresentado o estudo de seleção de ferramentas de Data Mining, assim como as experiências de comparação de performance das ferramentas selecionadas. Por fim, é apresentada a discussão dos resultados, onde também é apresentada uma análise SWOT, e a conclusão.Technological developments and the growing dependence of organizations and society in the world of the internet, led to the growth and variety of data. This growth and variety has become a challenge for data handlers, since processing a large amount of data can be challenging because it can take a great deal of time. Thus, came the creation of the Big Data concept. Big Data can be understood as a large set of data with various structures, which the traditional technology can not handle, having difficulty in storage and process them. In this dissertation, two concepts will be defined. Therefore, this dissertation focuses on the challenges that Big Data puts the Data Mining. In this dissertation was analyzed a study of selection of Data Mining tools, where they were used two methodologies taking in consideration various criteria of evaluation. Subsequently, based on the results of the previous study, were selected the two best tools, KNIME and RapidMiner. In this dissertation are also presented some suggestions of good practice when dealing with data. After the tools were selected, was analyzed a study on the performance of the tools KNIME and RapidMiner in the Big Data environment. At the beginning of this document is presented the context of this project and its purpose. Then, the literature review is presented describing the main concepts and topics related to the dissertation. Subsequently, the methodological approaches used in this dissertation are presented, as well as how they were used. Then, is presented the Data Mining tool selection study, as well as the performance comparison experiments of the selected tools. Finally, a discussion of the results is presented, which also presents a SWOT analysis, and the conclusion.Santos, ManuelUniversidade do MinhoOliveira, Cátia Cristina Pereira20202020-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/76442por202956997info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:05:39Zoai:repositorium.sdum.uminho.pt:1822/76442Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:56:08.702234Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Benchmarking de técnicas de Bussiness Analytics em Big Data
title Benchmarking de técnicas de Bussiness Analytics em Big Data
spellingShingle Benchmarking de técnicas de Bussiness Analytics em Big Data
Oliveira, Cátia Cristina Pereira
Benchmarking
Técnicas
Business analytics
Big data
Techniques
Business analytics
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
title_short Benchmarking de técnicas de Bussiness Analytics em Big Data
title_full Benchmarking de técnicas de Bussiness Analytics em Big Data
title_fullStr Benchmarking de técnicas de Bussiness Analytics em Big Data
title_full_unstemmed Benchmarking de técnicas de Bussiness Analytics em Big Data
title_sort Benchmarking de técnicas de Bussiness Analytics em Big Data
author Oliveira, Cátia Cristina Pereira
author_facet Oliveira, Cátia Cristina Pereira
author_role author
dc.contributor.none.fl_str_mv Santos, Manuel
Universidade do Minho
dc.contributor.author.fl_str_mv Oliveira, Cátia Cristina Pereira
dc.subject.por.fl_str_mv Benchmarking
Técnicas
Business analytics
Big data
Techniques
Business analytics
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
topic Benchmarking
Técnicas
Business analytics
Big data
Techniques
Business analytics
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
description Dissertação de mestrado em Engenharia e Gestão de Sistemas de Informação
publishDate 2020
dc.date.none.fl_str_mv 2020
2020-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/76442
url http://hdl.handle.net/1822/76442
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 202956997
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132348235644928