Benchmarking de técnicas de Bussiness Analytics em Big Data
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/1822/76442 |
Resumo: | Dissertação de mestrado em Engenharia e Gestão de Sistemas de Informação |
id |
RCAP_5088d5ae803236cd98fa9f446127b4d2 |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/76442 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Benchmarking de técnicas de Bussiness Analytics em Big DataBenchmarkingTécnicasBusiness analyticsBig dataTechniquesBusiness analyticsEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado em Engenharia e Gestão de Sistemas de InformaçãoOs desenvolvimentos tecnológicos e a crescente dependência das organizações e da sociedade no mundo da internet levaram ao crescimento e variedade de dados. Esse crescimento e variedade, tornaram-se num desafio para os manipuladores de dados, uma vez que o processamento de uma grande quantidade de dados pode ser um desafio, porque pode despender muito tempo. Assim, veio a criação do conceito Big Data. Big Data pode ser entendido como um grande conjunto de dados com várias estruturas, que a tecnologia tradicional não consegue lidar, tendo dificuldade de armazenamento e de processamento. Nesta dissertação, serão definidos dois conceitos. Portanto, esta dissertação foca nos desafios que o Big Data coloca ao Data Mining, Nesta dissertação foi analisado um estudo de seleção de ferramentas de Data Mining, onde foram utilizadas duas metodologias tendo em consideração vários critérios de avaliação. Posteriormente, com base nos resultados do estudo anterior, foram selecionadas as duas melhores ferramentas, KNIME e RapidMiner. Nesta dissertação também são apresentadas algumas sugestões de boas práticas quando lidamos com dados. Depois de selecionadas as ferramentas, foi analisado um estudo referente à performance das ferramentas KNIME e RapidMiner em ambiente Big Data. No inicio deste documento é apresentado um enquadramento do projeto e qual o seu objetivo. De seguida, é apresentado a revisão de literatura onde são descritos os principais conceitos e tópicos relacionados com a dissertação. Posteriormente, são apresentadas as abordagens metodológicas utilizadas nesta dissertação, assim como de que forma foram utilizadas. De seguida, são apresentados os desafios de Big Data Mining. Seguidamente, é apresentado o estudo de seleção de ferramentas de Data Mining, assim como as experiências de comparação de performance das ferramentas selecionadas. Por fim, é apresentada a discussão dos resultados, onde também é apresentada uma análise SWOT, e a conclusão.Technological developments and the growing dependence of organizations and society in the world of the internet, led to the growth and variety of data. This growth and variety has become a challenge for data handlers, since processing a large amount of data can be challenging because it can take a great deal of time. Thus, came the creation of the Big Data concept. Big Data can be understood as a large set of data with various structures, which the traditional technology can not handle, having difficulty in storage and process them. In this dissertation, two concepts will be defined. Therefore, this dissertation focuses on the challenges that Big Data puts the Data Mining. In this dissertation was analyzed a study of selection of Data Mining tools, where they were used two methodologies taking in consideration various criteria of evaluation. Subsequently, based on the results of the previous study, were selected the two best tools, KNIME and RapidMiner. In this dissertation are also presented some suggestions of good practice when dealing with data. After the tools were selected, was analyzed a study on the performance of the tools KNIME and RapidMiner in the Big Data environment. At the beginning of this document is presented the context of this project and its purpose. Then, the literature review is presented describing the main concepts and topics related to the dissertation. Subsequently, the methodological approaches used in this dissertation are presented, as well as how they were used. Then, is presented the Data Mining tool selection study, as well as the performance comparison experiments of the selected tools. Finally, a discussion of the results is presented, which also presents a SWOT analysis, and the conclusion.Santos, ManuelUniversidade do MinhoOliveira, Cátia Cristina Pereira20202020-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/76442por202956997info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:05:39Zoai:repositorium.sdum.uminho.pt:1822/76442Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:56:08.702234Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Benchmarking de técnicas de Bussiness Analytics em Big Data |
title |
Benchmarking de técnicas de Bussiness Analytics em Big Data |
spellingShingle |
Benchmarking de técnicas de Bussiness Analytics em Big Data Oliveira, Cátia Cristina Pereira Benchmarking Técnicas Business analytics Big data Techniques Business analytics Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
title_short |
Benchmarking de técnicas de Bussiness Analytics em Big Data |
title_full |
Benchmarking de técnicas de Bussiness Analytics em Big Data |
title_fullStr |
Benchmarking de técnicas de Bussiness Analytics em Big Data |
title_full_unstemmed |
Benchmarking de técnicas de Bussiness Analytics em Big Data |
title_sort |
Benchmarking de técnicas de Bussiness Analytics em Big Data |
author |
Oliveira, Cátia Cristina Pereira |
author_facet |
Oliveira, Cátia Cristina Pereira |
author_role |
author |
dc.contributor.none.fl_str_mv |
Santos, Manuel Universidade do Minho |
dc.contributor.author.fl_str_mv |
Oliveira, Cátia Cristina Pereira |
dc.subject.por.fl_str_mv |
Benchmarking Técnicas Business analytics Big data Techniques Business analytics Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
topic |
Benchmarking Técnicas Business analytics Big data Techniques Business analytics Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
description |
Dissertação de mestrado em Engenharia e Gestão de Sistemas de Informação |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020 2020-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1822/76442 |
url |
http://hdl.handle.net/1822/76442 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
202956997 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799132348235644928 |