Opinion Mining Framework
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/92166 |
Resumo: | Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia |
id |
RCAP_286a8d112df243f44dc751c53510f460 |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/92166 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Opinion Mining FrameworkOpinion Mining FrameworkProcessamento de Linguagem NaturalAnálise de SentimentoExtração de OpiniãoNatural Language ProcessingSentiment AnalysisOpinion MiningDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e TecnologiaNos dias correntes, a quantidade de informação que cada pessoa produz é estonteante. Estefacto resulta numa acumulação de grandes volumes de informação. Uma parte relevantedessa informação pode ser extremamente útil para empresas, se for analisada corretamente.Atualmente, quando adquirimos ou utilizamos um produto, é comum deixar alguma formade crítica, tanto na forma de questionários, blogs ou posts num fórum, ou até só um pequenotexto na página da plataforma de onde adquirimos o produto.Para uma empresa, saber o que os seus potenciais clientes procuram, o que gostam ou oque não gostam é informação extremamente valiosa, uma vez que permitiria à empresadesenvolver produtos que seriam mais apelativos. Se estivermos a falar de call centersassociados a empresas, e se as conversas telefónicas forem guardadas em formato de texto,seria possível obtermos informações relevantes sobre os produtos da empresa ou da suaimagem. No entanto, dado o grande número the chamadas que são tratadas num callcenter, é extremamente dispendioso tanto em termos de tempo e esforço analisar as opiniõesexistentes nos dados.A criação de uma ferramenta que nos permita avaliar automaticamente a opinião declientes, sobre diferentes produtos e as suas respectivas características, seria uma grandecontribuição na recolha de informação sobre que aspetos os clientes gostam ou não nosprodutos. Isto iria permitir que as empresas possam melhorar os seus produtos com basenesses comentários.Um dos principais problemas no desenvolvimento de tal ferramenta é a escassez de dadosanotados de diálogo para opinion mining. Assim sendo, um dos objetivos deste estágio écriar um dataset de opinion mining com diálogos. A falta de dados anotados de opinion mining com diálogos resulta em abordagens que apresentam bons resultados maioritariamentepara datasets de reviews. Estes datasets s ão muito diferentes do que nós desejaríamos teridealmente. Assim sendo, propomos testar algumas abordagens com bons resultados emopinion mining no novo dataset que iremos criar e realizaremos uma análise das mesmas.Devido à diferença entre o caso de uso pretendido das abordagens e o caso de uso a testar,é de esperar que os resultados sejam inferiores para esta situação. Como objetivo opcional,iremos tentar melhorar a performance das abordagens mais promissoras.Nowadays, the amount of information each person produces is astounding. This results inthe accumulation of large amounts of data. Quite a relevant amount of this data can beuseful for companies if analyzed properly. Currently, when we purchase or use a product,it is common for us to leave feedback in some form, either by surveys, blog or forum posts,or just a small text on the web page we purchased the article from.For a company, knowing what their potential customers are looking for, what they like ordislike is invaluable, as it would enable them to develop products that could become moreappealing. Assuming we are talking about a contact center associated with a company,if conversations are stored in text format, we could obtain extremely relevant informationabout the company’s products and image. However, given the usually large number ofcalls that are handled in a contact center, it is extremely costly both in terms of time andeffort to actually assess the overall opinions expressed on the existing data.The creation of a tool that would allow us to automatically assess the opinions of customers, concerning different products and their respective features, would go a long wayto efficiently collect information on what aspects customers like and dislike on products.This would allow companies to improve their products based on that feedback.One of the main problems of developing such a tool is the lack of annotated dialoguedatasets for opinion mining. As such, one of the objectives of this internship is to createan opinion mining dialogue dataset. Due to the scarcity of dialogue datasets for opinionmining, state-of-the-art approaches for opinion mining are mostly tested on datasets fromreviews. These datasets are very different in structure to what we would ideally want.Therefore, we propose to test some state-of-the-art opinion mining approaches on the newdataset that will be developed and thoroughly analyze them. Due to the different intendeduse case of the approaches, lackluster results are expected. As an optional goal, we will beattempting to improve the performance of the most promising analyzed approaches.2020-11-04info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/92166http://hdl.handle.net/10316/92166TID:202553850engPedroso, Maria Fernandesinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-05-25T04:54:58Zoai:estudogeral.uc.pt:10316/92166Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:11:20.025795Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Opinion Mining Framework Opinion Mining Framework |
title |
Opinion Mining Framework |
spellingShingle |
Opinion Mining Framework Pedroso, Maria Fernandes Processamento de Linguagem Natural Análise de Sentimento Extração de Opinião Natural Language Processing Sentiment Analysis Opinion Mining |
title_short |
Opinion Mining Framework |
title_full |
Opinion Mining Framework |
title_fullStr |
Opinion Mining Framework |
title_full_unstemmed |
Opinion Mining Framework |
title_sort |
Opinion Mining Framework |
author |
Pedroso, Maria Fernandes |
author_facet |
Pedroso, Maria Fernandes |
author_role |
author |
dc.contributor.author.fl_str_mv |
Pedroso, Maria Fernandes |
dc.subject.por.fl_str_mv |
Processamento de Linguagem Natural Análise de Sentimento Extração de Opinião Natural Language Processing Sentiment Analysis Opinion Mining |
topic |
Processamento de Linguagem Natural Análise de Sentimento Extração de Opinião Natural Language Processing Sentiment Analysis Opinion Mining |
description |
Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-11-04 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/92166 http://hdl.handle.net/10316/92166 TID:202553850 |
url |
http://hdl.handle.net/10316/92166 |
identifier_str_mv |
TID:202553850 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1817550934435168256 |