Data analytics para variedade de dados

Detalhes bibliográficos
Autor(a) principal: Cruz, Tiago Emanuel Senra da
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/1822/54536
Resumo: Dissertação de mestrado integrado em Engenharia e Gestão de Sistemas de Informação
id RCAP_0eff364343a092b46e415de2c00fa577
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/54536
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Data analytics para variedade de dadosAnálise de dadosTipos de dadosTécnicas de análise de dadosData analyticsAnalyticsData typesAnalytic techniquesEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado integrado em Engenharia e Gestão de Sistemas de InformaçãoA Internet permitiu que os gestores das organizações tivessem acesso a grandes quantidades de dados, e esses dados são apresentados em diferentes formatos, em concreto estruturados, semiestruturados e não estruturados. Neste momento, esta variedade de dados é, em parte, oriunda das redes sociais, onde os utilizadores geram conteúdos diversificados como por exemplo websites, blogs, imagens, vídeos entre outros, mas não só, mas também as máquinas são capazes de partilhar informações entre si, ou máquinas com pessoas, através da internet. Os tipos de dados gerados já não são apenas do formato estruturado, mas semiestruturados e não estruturados. Face à variedade de dados disponíveis, é realçada a importância de analisar estes dados para que os gestores possam tirar partido deles para a tomada de decisão. Verifica-se para os dados estruturados que já existem técnicas validadas, estudadas e maduras, mas para os outros tipos de dados semiestruturados e não estruturados tal não se verifica. O objetivo desta dissertação passou por perceber face à variedade de dados existente, nomeadamente dados não estruturados e semiestruturados, que tipo de informações é possível retirar desses dados, através da sua análise. Foi realizada uma experiência, utilizando um dataset com comentários de carros e um conjunto de imagens para ilustrar o modelo do carro. Foram utilizadas quatro técnicas de análise distintas, sendo elas: Processamento da Linguagem Natural; Análise de Sentimento; Análise de Emoção e Reconhecimento de imagens; para retirar informações desses dados. De seguida foi procedido a criação de uma plataforma analítica e a sua visualização através de dashboards. Verifica-se que é assim possível retirar um conjunto de informações, como a análise de sentimento, emoção, quais as componentes que as pessoas gostam mais/menos de um determinado carro, ou sobre uma categoria de carro, entre outras informações relevantes.The Internet has made it possible for organizations managers to have access to substantial amounts of data, and these data are presented in different formats, namely structured, semi-structured and unstructured. Now, this data variety is party derived from social networks, where users generate diverse content such as websites, blogs, images, videos, among others, but not only, also machines are able to share information between themselves, or machines with people, through the internet. The data formats generated are no longer just the structured, but also semi-structured and unstructured. Given the data variety available, the importance of analyzing this data is emphasized so that organization managers can benefit from it for decision-making. For structured data, there are already studied, validated and mature techniques, but for the other formats this is not the case. The purpose of this dissertation was to perceive due the data variety available, namely semi-structured and unstructured data, which kind of information can be extracted from these data, through its analysis. An experiment was conducted using a dataset containing car reviews and a set of images to illustrate the car model. Four different analysis techniques were used to extract information: Natural Language Processing; Sentiment analysis; Emotion analysis; and Image recognition; from these data. Then the next step was the creation of an analytical platform and is visualization through dashboards. It turns out that it is possible to withdraw a set of information, such as the feeling analysis, emotion, witch components people like the most/ less of a car, or about a car category, among other relevant information.Oliveira e Sá, JorgeUniversidade do MinhoCruz, Tiago Emanuel Senra da20172017-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/54536por201897180info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:07:55Zoai:repositorium.sdum.uminho.pt:1822/54536Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:59:00.692927Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Data analytics para variedade de dados
title Data analytics para variedade de dados
spellingShingle Data analytics para variedade de dados
Cruz, Tiago Emanuel Senra da
Análise de dados
Tipos de dados
Técnicas de análise de dados
Data analytics
Analytics
Data types
Analytic techniques
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
title_short Data analytics para variedade de dados
title_full Data analytics para variedade de dados
title_fullStr Data analytics para variedade de dados
title_full_unstemmed Data analytics para variedade de dados
title_sort Data analytics para variedade de dados
author Cruz, Tiago Emanuel Senra da
author_facet Cruz, Tiago Emanuel Senra da
author_role author
dc.contributor.none.fl_str_mv Oliveira e Sá, Jorge
Universidade do Minho
dc.contributor.author.fl_str_mv Cruz, Tiago Emanuel Senra da
dc.subject.por.fl_str_mv Análise de dados
Tipos de dados
Técnicas de análise de dados
Data analytics
Analytics
Data types
Analytic techniques
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
topic Análise de dados
Tipos de dados
Técnicas de análise de dados
Data analytics
Analytics
Data types
Analytic techniques
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
description Dissertação de mestrado integrado em Engenharia e Gestão de Sistemas de Informação
publishDate 2017
dc.date.none.fl_str_mv 2017
2017-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/54536
url http://hdl.handle.net/1822/54536
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 201897180
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132381496475648