Data analytics para variedade de dados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/1822/54536 |
Resumo: | Dissertação de mestrado integrado em Engenharia e Gestão de Sistemas de Informação |
id |
RCAP_0eff364343a092b46e415de2c00fa577 |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/54536 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Data analytics para variedade de dadosAnálise de dadosTipos de dadosTécnicas de análise de dadosData analyticsAnalyticsData typesAnalytic techniquesEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado integrado em Engenharia e Gestão de Sistemas de InformaçãoA Internet permitiu que os gestores das organizações tivessem acesso a grandes quantidades de dados, e esses dados são apresentados em diferentes formatos, em concreto estruturados, semiestruturados e não estruturados. Neste momento, esta variedade de dados é, em parte, oriunda das redes sociais, onde os utilizadores geram conteúdos diversificados como por exemplo websites, blogs, imagens, vídeos entre outros, mas não só, mas também as máquinas são capazes de partilhar informações entre si, ou máquinas com pessoas, através da internet. Os tipos de dados gerados já não são apenas do formato estruturado, mas semiestruturados e não estruturados. Face à variedade de dados disponíveis, é realçada a importância de analisar estes dados para que os gestores possam tirar partido deles para a tomada de decisão. Verifica-se para os dados estruturados que já existem técnicas validadas, estudadas e maduras, mas para os outros tipos de dados semiestruturados e não estruturados tal não se verifica. O objetivo desta dissertação passou por perceber face à variedade de dados existente, nomeadamente dados não estruturados e semiestruturados, que tipo de informações é possível retirar desses dados, através da sua análise. Foi realizada uma experiência, utilizando um dataset com comentários de carros e um conjunto de imagens para ilustrar o modelo do carro. Foram utilizadas quatro técnicas de análise distintas, sendo elas: Processamento da Linguagem Natural; Análise de Sentimento; Análise de Emoção e Reconhecimento de imagens; para retirar informações desses dados. De seguida foi procedido a criação de uma plataforma analítica e a sua visualização através de dashboards. Verifica-se que é assim possível retirar um conjunto de informações, como a análise de sentimento, emoção, quais as componentes que as pessoas gostam mais/menos de um determinado carro, ou sobre uma categoria de carro, entre outras informações relevantes.The Internet has made it possible for organizations managers to have access to substantial amounts of data, and these data are presented in different formats, namely structured, semi-structured and unstructured. Now, this data variety is party derived from social networks, where users generate diverse content such as websites, blogs, images, videos, among others, but not only, also machines are able to share information between themselves, or machines with people, through the internet. The data formats generated are no longer just the structured, but also semi-structured and unstructured. Given the data variety available, the importance of analyzing this data is emphasized so that organization managers can benefit from it for decision-making. For structured data, there are already studied, validated and mature techniques, but for the other formats this is not the case. The purpose of this dissertation was to perceive due the data variety available, namely semi-structured and unstructured data, which kind of information can be extracted from these data, through its analysis. An experiment was conducted using a dataset containing car reviews and a set of images to illustrate the car model. Four different analysis techniques were used to extract information: Natural Language Processing; Sentiment analysis; Emotion analysis; and Image recognition; from these data. Then the next step was the creation of an analytical platform and is visualization through dashboards. It turns out that it is possible to withdraw a set of information, such as the feeling analysis, emotion, witch components people like the most/ less of a car, or about a car category, among other relevant information.Oliveira e Sá, JorgeUniversidade do MinhoCruz, Tiago Emanuel Senra da20172017-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/54536por201897180info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:07:55Zoai:repositorium.sdum.uminho.pt:1822/54536Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:59:00.692927Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Data analytics para variedade de dados |
title |
Data analytics para variedade de dados |
spellingShingle |
Data analytics para variedade de dados Cruz, Tiago Emanuel Senra da Análise de dados Tipos de dados Técnicas de análise de dados Data analytics Analytics Data types Analytic techniques Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
title_short |
Data analytics para variedade de dados |
title_full |
Data analytics para variedade de dados |
title_fullStr |
Data analytics para variedade de dados |
title_full_unstemmed |
Data analytics para variedade de dados |
title_sort |
Data analytics para variedade de dados |
author |
Cruz, Tiago Emanuel Senra da |
author_facet |
Cruz, Tiago Emanuel Senra da |
author_role |
author |
dc.contributor.none.fl_str_mv |
Oliveira e Sá, Jorge Universidade do Minho |
dc.contributor.author.fl_str_mv |
Cruz, Tiago Emanuel Senra da |
dc.subject.por.fl_str_mv |
Análise de dados Tipos de dados Técnicas de análise de dados Data analytics Analytics Data types Analytic techniques Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
topic |
Análise de dados Tipos de dados Técnicas de análise de dados Data analytics Analytics Data types Analytic techniques Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
description |
Dissertação de mestrado integrado em Engenharia e Gestão de Sistemas de Informação |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017 2017-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1822/54536 |
url |
http://hdl.handle.net/1822/54536 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
201897180 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799132381496475648 |