Aspect Term Extraction in Aspect-Based Sentiment Analysis

Detalhes bibliográficos
Autor(a) principal: Francisco, Alesson Delmiro
Data de Publicação: 2019
Tipo de documento: Trabalho de conclusão de curso
Idioma: eng
Título da fonte: Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE)
Texto Completo: https://repository.ufrpe.br/handle/123456789/2133
Resumo: O uso crescente da Internet criou a necessidade de analisar uma vasta quantidade dedados. Uma grande quantia de dados é apresentada como Texto em Linguagem Naturalnão estruturado, com várias maneiras de expressar a mesma informação. É uma tarefaimportante extrair informação e significado destes conteúdos não estruturados, comoopiniões em produtos ou serviços. A necessidade de extrair e analisar a vasta quantidadede dados criados todos os dias na Internet ultrapassou as capacidades humanas, comoresultado, várias aplicações de mineração de texto que extraem e analisam dados textuaisproduzidos por humanos estão disponíveis atualmente, uma destas aplicações é a Análise deSentimentos usada para que empresas e provedores de serviços possam usar o conhecimentoextraído de documentos textuais para melhor entender como seus clientes pensam sobreeles. No entanto, a tarefa de analisar texto não estruturado é difícil, por isso é necessárioprover informação coerente e resumos concisos para as revisões. Análise de Sentimentoé o processo de identificar e categorizar computacionalmente opiniões expressadas numtexto, especialmente para determinar a atitude do autor sobre um tópico ou produto emparticular. Análise de Sentimentos Baseada em Aspectos (ABSA) é um sub-campo daAnálise de Sentimentos que tem como objetivo extrair opiniões mais refinadas e exatas,quebrando o texto em aspectos. A maior parte dos trabalhos atuais na literatura não lucramde recursos baseados em semântica ou análises baseadas em Processamento de LinguagemNatural na fase de pré-processamento. Para tratar essas limitações, um estudo nestesrecursos é feito com o objetivo de extrair as características necessárias para a execuçãoda tarefa, e para fazer a melhor combinação para Extração de Termo de Aspecto. Estetrabalho tem como o principal objetivo implementar e analisar um método de Extraçãode Termo de Aspecto (ATE) de críticas de usuários (restaurantes e laptops). O métodoproposto é baseado em uma abordagem supervisionada chamada Campos CondicionaisAleatórios (CRF) que otimiza o uso de características para classificação, esta escolha éjustificada pelos trabalhos relacionados anteriores que demonstram a eficácia do CRFpara ATE. Um estudo também é feito em métodos para propor novas características eexperimantar com combinações de características para obter as melhores combinações.O estudo detalhado é feito a partir da experimentação com características de palavra,n-gramas e características customizadas utilizando um algoritmo supervisionado CRF pararealizar a tarefa de Extração de Termo de Aspecto com resultados em termo de Precisão,Cobertura e F-Measure, as métricas padrões de avaliação adotadas na área. Por fim, umaavaliação comparativa entre o método proposto para ATE contra outros trabalhos daliteratura mostra que o método apresentado neste trabalho é competitivo.
id UFRPE_c42c9a31ba0a2e5ba19be11f84df0e25
oai_identifier_str oai:dspace:123456789/2133
network_acronym_str UFRPE
network_name_str Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE)
repository_id_str https://v2.sherpa.ac.uk/id/repository/10612
spelling Aspect Term Extraction in Aspect-Based Sentiment AnalysisMineração de dados (Computação)Aprendizado do computadorAlgorítmos computacionaisEmoçõesO uso crescente da Internet criou a necessidade de analisar uma vasta quantidade dedados. Uma grande quantia de dados é apresentada como Texto em Linguagem Naturalnão estruturado, com várias maneiras de expressar a mesma informação. É uma tarefaimportante extrair informação e significado destes conteúdos não estruturados, comoopiniões em produtos ou serviços. A necessidade de extrair e analisar a vasta quantidadede dados criados todos os dias na Internet ultrapassou as capacidades humanas, comoresultado, várias aplicações de mineração de texto que extraem e analisam dados textuaisproduzidos por humanos estão disponíveis atualmente, uma destas aplicações é a Análise deSentimentos usada para que empresas e provedores de serviços possam usar o conhecimentoextraído de documentos textuais para melhor entender como seus clientes pensam sobreeles. No entanto, a tarefa de analisar texto não estruturado é difícil, por isso é necessárioprover informação coerente e resumos concisos para as revisões. Análise de Sentimentoé o processo de identificar e categorizar computacionalmente opiniões expressadas numtexto, especialmente para determinar a atitude do autor sobre um tópico ou produto emparticular. Análise de Sentimentos Baseada em Aspectos (ABSA) é um sub-campo daAnálise de Sentimentos que tem como objetivo extrair opiniões mais refinadas e exatas,quebrando o texto em aspectos. A maior parte dos trabalhos atuais na literatura não lucramde recursos baseados em semântica ou análises baseadas em Processamento de LinguagemNatural na fase de pré-processamento. Para tratar essas limitações, um estudo nestesrecursos é feito com o objetivo de extrair as características necessárias para a execuçãoda tarefa, e para fazer a melhor combinação para Extração de Termo de Aspecto. Estetrabalho tem como o principal objetivo implementar e analisar um método de Extraçãode Termo de Aspecto (ATE) de críticas de usuários (restaurantes e laptops). O métodoproposto é baseado em uma abordagem supervisionada chamada Campos CondicionaisAleatórios (CRF) que otimiza o uso de características para classificação, esta escolha éjustificada pelos trabalhos relacionados anteriores que demonstram a eficácia do CRFpara ATE. Um estudo também é feito em métodos para propor novas características eexperimantar com combinações de características para obter as melhores combinações.O estudo detalhado é feito a partir da experimentação com características de palavra,n-gramas e características customizadas utilizando um algoritmo supervisionado CRF pararealizar a tarefa de Extração de Termo de Aspecto com resultados em termo de Precisão,Cobertura e F-Measure, as métricas padrões de avaliação adotadas na área. Por fim, umaavaliação comparativa entre o método proposto para ATE contra outros trabalhos daliteratura mostra que o método apresentado neste trabalho é competitivo.The increasing use of the Internet in many directions has created a necessity to analyze alarge quantity of data. A large amount of data is presented as Natural Language Text,which is unstructured, with many ways to express the same information. It is an importanttask to extract information and meaning from those unstructured content, such as opinionson products or services. The need to extract and analyze the large amount of data createdevery day on the Internet surpassed the capabilities of human ability, as a result, manytext mining applications that extract and analyze textual data produced by humans areavailable today, one of such kind of applications is Sentiment Analysis, viewed as a vitaltask both to the academic and commercial fields, so that companies and service providerscan use that knowledge extracted from textual documents to better understand how theircustomers think about them or to know how their products and services are appreciated ornot by their customers. However, the task of analysing unstructured text is a difficult one,that is why it is necessary to provide coherent information and concise summaries to thoserevisions. Sentiment Analysis is the process of computationally identifying and categorizingopinions expressed in a piece of text, especially in order to determine the writer’s attitudetowards a particular topic or product. Aspect-Based Sentiment Analysis is a sub-field ofSentiment Analysis that aims to extract more refined and exact opinions, by breakingdown text into aspects. Most of the current work in the literature does not take profitof either semantic-based resources or NLP-based analysis in the preprocessing stage. Tocountermeasure these limitations, a study on these resources is done aiming to extract thefeatures needed to execute the task, and to make the best combination for ATE. This workhas the main goal of implementing and analysing a method of Aspect Term Extraction(ATE) of users reviews (restaurants and laptops). The proposed method is based on asupervised approach called Conditional Random Fields (CRF) which is able to optimizethe use of features for classification, this choice was justified by previous related work thatdemonstrate the effectiveness of CRF for ATE. Also, we are investigating the existingmethods and features for ABSA, as well as proposing new features and experimentingwith feature combinations in order to find the best features combinations, that are not yetcovered in the state of art. The detailed study is done by experimenting with word features,n-grams and custom made features using an CRF supervised algorithm to accomplish thetask of Aspect Term Extraction with results in terms of Precision, Recall and F-measure,the standard evaluation metrics adopted in the field. Finally, a comparative assessmentbetween the proposal method for ATE against other related work presented in the literaturehas shown that the method presented by this work is competitive.BrasilLima, Rinaldo José dehttp://lattes.cnpq.br/7645118086647340Francisco, Alesson Delmiro2020-03-31T18:10:47Z2020-03-31T18:10:47Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis59 f.application/pdfFRANCISCO, Alesson Delmiro. Aspect Term Extraction in Aspect-BasedSentiment Analysis. 2019. 59 f.Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação)- Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2019.https://repository.ufrpe.br/handle/123456789/2133Atribuição-NãoComercial-CompartilhaIgual 4.0 Internacional (CC BY-NC-SA 4.0)https://creativecommons.org/licenses/by-nc-sa/4.0/deed.pt_BRopenAccessinfo:eu-repo/semantics/openAccessengreponame:Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE)instname:Universidade Federal Rural de Pernambuco (UFRPE)instacron:UFRPE2020-03-31T18:10:48Zoai:dspace:123456789/2133Repositório InstitucionalPUBhttps://repository.ufrpe.br/oai/requestrepositorio.sib@ufrpe.bropendoar:https://v2.sherpa.ac.uk/id/repository/106122020-03-31T18:10:48Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE) - Universidade Federal Rural de Pernambuco (UFRPE)false
dc.title.none.fl_str_mv Aspect Term Extraction in Aspect-Based Sentiment Analysis
title Aspect Term Extraction in Aspect-Based Sentiment Analysis
spellingShingle Aspect Term Extraction in Aspect-Based Sentiment Analysis
Francisco, Alesson Delmiro
Mineração de dados (Computação)
Aprendizado do computador
Algorítmos computacionais
Emoções
title_short Aspect Term Extraction in Aspect-Based Sentiment Analysis
title_full Aspect Term Extraction in Aspect-Based Sentiment Analysis
title_fullStr Aspect Term Extraction in Aspect-Based Sentiment Analysis
title_full_unstemmed Aspect Term Extraction in Aspect-Based Sentiment Analysis
title_sort Aspect Term Extraction in Aspect-Based Sentiment Analysis
author Francisco, Alesson Delmiro
author_facet Francisco, Alesson Delmiro
author_role author
dc.contributor.none.fl_str_mv Lima, Rinaldo José de
http://lattes.cnpq.br/7645118086647340
dc.contributor.author.fl_str_mv Francisco, Alesson Delmiro
dc.subject.por.fl_str_mv Mineração de dados (Computação)
Aprendizado do computador
Algorítmos computacionais
Emoções
topic Mineração de dados (Computação)
Aprendizado do computador
Algorítmos computacionais
Emoções
description O uso crescente da Internet criou a necessidade de analisar uma vasta quantidade dedados. Uma grande quantia de dados é apresentada como Texto em Linguagem Naturalnão estruturado, com várias maneiras de expressar a mesma informação. É uma tarefaimportante extrair informação e significado destes conteúdos não estruturados, comoopiniões em produtos ou serviços. A necessidade de extrair e analisar a vasta quantidadede dados criados todos os dias na Internet ultrapassou as capacidades humanas, comoresultado, várias aplicações de mineração de texto que extraem e analisam dados textuaisproduzidos por humanos estão disponíveis atualmente, uma destas aplicações é a Análise deSentimentos usada para que empresas e provedores de serviços possam usar o conhecimentoextraído de documentos textuais para melhor entender como seus clientes pensam sobreeles. No entanto, a tarefa de analisar texto não estruturado é difícil, por isso é necessárioprover informação coerente e resumos concisos para as revisões. Análise de Sentimentoé o processo de identificar e categorizar computacionalmente opiniões expressadas numtexto, especialmente para determinar a atitude do autor sobre um tópico ou produto emparticular. Análise de Sentimentos Baseada em Aspectos (ABSA) é um sub-campo daAnálise de Sentimentos que tem como objetivo extrair opiniões mais refinadas e exatas,quebrando o texto em aspectos. A maior parte dos trabalhos atuais na literatura não lucramde recursos baseados em semântica ou análises baseadas em Processamento de LinguagemNatural na fase de pré-processamento. Para tratar essas limitações, um estudo nestesrecursos é feito com o objetivo de extrair as características necessárias para a execuçãoda tarefa, e para fazer a melhor combinação para Extração de Termo de Aspecto. Estetrabalho tem como o principal objetivo implementar e analisar um método de Extraçãode Termo de Aspecto (ATE) de críticas de usuários (restaurantes e laptops). O métodoproposto é baseado em uma abordagem supervisionada chamada Campos CondicionaisAleatórios (CRF) que otimiza o uso de características para classificação, esta escolha éjustificada pelos trabalhos relacionados anteriores que demonstram a eficácia do CRFpara ATE. Um estudo também é feito em métodos para propor novas características eexperimantar com combinações de características para obter as melhores combinações.O estudo detalhado é feito a partir da experimentação com características de palavra,n-gramas e características customizadas utilizando um algoritmo supervisionado CRF pararealizar a tarefa de Extração de Termo de Aspecto com resultados em termo de Precisão,Cobertura e F-Measure, as métricas padrões de avaliação adotadas na área. Por fim, umaavaliação comparativa entre o método proposto para ATE contra outros trabalhos daliteratura mostra que o método apresentado neste trabalho é competitivo.
publishDate 2019
dc.date.none.fl_str_mv 2019
2020-03-31T18:10:47Z
2020-03-31T18:10:47Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv FRANCISCO, Alesson Delmiro. Aspect Term Extraction in Aspect-BasedSentiment Analysis. 2019. 59 f.Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação)- Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2019.
https://repository.ufrpe.br/handle/123456789/2133
identifier_str_mv FRANCISCO, Alesson Delmiro. Aspect Term Extraction in Aspect-BasedSentiment Analysis. 2019. 59 f.Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação)- Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2019.
url https://repository.ufrpe.br/handle/123456789/2133
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv Atribuição-NãoComercial-CompartilhaIgual 4.0 Internacional (CC BY-NC-SA 4.0)
https://creativecommons.org/licenses/by-nc-sa/4.0/deed.pt_BR
openAccess
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribuição-NãoComercial-CompartilhaIgual 4.0 Internacional (CC BY-NC-SA 4.0)
https://creativecommons.org/licenses/by-nc-sa/4.0/deed.pt_BR
openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 59 f.
application/pdf
dc.publisher.none.fl_str_mv Brasil
publisher.none.fl_str_mv Brasil
dc.source.none.fl_str_mv reponame:Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE)
instname:Universidade Federal Rural de Pernambuco (UFRPE)
instacron:UFRPE
instname_str Universidade Federal Rural de Pernambuco (UFRPE)
instacron_str UFRPE
institution UFRPE
reponame_str Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE)
collection Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE)
repository.name.fl_str_mv Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE) - Universidade Federal Rural de Pernambuco (UFRPE)
repository.mail.fl_str_mv repositorio.sib@ufrpe.br
_version_ 1809277156038017024