Sumarização contrastiva de opinião
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-04022020-154902/ |
Resumo: | Esta dissertação apresenta métodos que permitem comparar entidades por meio da geração de um resumo que realce diferenças entre elas a partir do processamento automático de textos opinativos. Métodos de sumarização contrastiva de opinião foram descritos e avaliados. Três métodos foram trazidos da literatura e um método foi criado. Os métodos foram testados em textos opinativos pré-anotados sobre eletrônicos de uso pessoal extraídos da Web. Embora existam alguns métodos publicados anteriormente, não houve um estudo que os compare: os métodos foram testados em conjuntos de dados diferentes e avaliados com métricas diferentes. Partindo da hipótese que os métodos gerarão sumários com características diferentes para um mesmo conjunto de dados, este trabalho busca suprir essa lacuna montando um conjunto de dados diversificado e definindo métricas padronizadas para testar características desejáveis dos sumários gerados por cada método. A importância da sumarização automática se dá porque ela permite o desenvolvimento de ferramentas que ajudam usuários a absorver melhor as informações de um conjunto de texto, especialmente se esse conjunto for muito grande, como ocorre com dados coletados em massa da Internet. A sumarização contrastiva de opinião toca uma parte mais específica do problema: o caso em que um usuário deseja comparar duas entidades a partir de um grande volume de textos opinativos. Esta pesquisa permite identificar quanto os resumos gerados por diferentes métodos são úteis para os usuários; conjectura-se que eles são mais eficazes do que resumos de opinião simples na tarefa de ajudar as pessoas a entender diferenças entre duas entidades. Isso pode ser benéfico para uma pessoa que quer comprar um produto e está em dúvida entre duas marcas ou dois modelos. Também pode ser útil para um fabricante entender como seus produtos se posicionam segundo a opinião popular em relação a seus concorrentes. Espera-se que esta pesquisa traga contribuições tanto no âmbito acadêmico quanto no contexto prático. Do ponto de vista prático, ela tem o potencial de permitir o desenvolvimento de ferramentas as quais empresas e usuários demandam. Na academia, ela se unirá às iniciativas recentes de pesquisa em Processamento de Linguagem Natural e Mineração de Opinião que têm ganhado destaque no Brasil, dando continuidade a seus trabalhos e somando a elas ideias novas que poderão ser futuramente utilizadas por outros pesquisadores. |
id |
USP_85fc12ea9718e64c3642ee7b9d9770cb |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-04022020-154902 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Sumarização contrastiva de opiniãoContrastive Opinion SummarizationContrastive opinion SummarizationNatural language processingProcessamento de linguagem naturalSumarização Contrastiva de opiniãoEsta dissertação apresenta métodos que permitem comparar entidades por meio da geração de um resumo que realce diferenças entre elas a partir do processamento automático de textos opinativos. Métodos de sumarização contrastiva de opinião foram descritos e avaliados. Três métodos foram trazidos da literatura e um método foi criado. Os métodos foram testados em textos opinativos pré-anotados sobre eletrônicos de uso pessoal extraídos da Web. Embora existam alguns métodos publicados anteriormente, não houve um estudo que os compare: os métodos foram testados em conjuntos de dados diferentes e avaliados com métricas diferentes. Partindo da hipótese que os métodos gerarão sumários com características diferentes para um mesmo conjunto de dados, este trabalho busca suprir essa lacuna montando um conjunto de dados diversificado e definindo métricas padronizadas para testar características desejáveis dos sumários gerados por cada método. A importância da sumarização automática se dá porque ela permite o desenvolvimento de ferramentas que ajudam usuários a absorver melhor as informações de um conjunto de texto, especialmente se esse conjunto for muito grande, como ocorre com dados coletados em massa da Internet. A sumarização contrastiva de opinião toca uma parte mais específica do problema: o caso em que um usuário deseja comparar duas entidades a partir de um grande volume de textos opinativos. Esta pesquisa permite identificar quanto os resumos gerados por diferentes métodos são úteis para os usuários; conjectura-se que eles são mais eficazes do que resumos de opinião simples na tarefa de ajudar as pessoas a entender diferenças entre duas entidades. Isso pode ser benéfico para uma pessoa que quer comprar um produto e está em dúvida entre duas marcas ou dois modelos. Também pode ser útil para um fabricante entender como seus produtos se posicionam segundo a opinião popular em relação a seus concorrentes. Espera-se que esta pesquisa traga contribuições tanto no âmbito acadêmico quanto no contexto prático. Do ponto de vista prático, ela tem o potencial de permitir o desenvolvimento de ferramentas as quais empresas e usuários demandam. Na academia, ela se unirá às iniciativas recentes de pesquisa em Processamento de Linguagem Natural e Mineração de Opinião que têm ganhado destaque no Brasil, dando continuidade a seus trabalhos e somando a elas ideias novas que poderão ser futuramente utilizadas por outros pesquisadores.This theses presents automatic techniques for comparing opinions by generating summaries that highlight differences and similarities between two entities given a set of opinionated text. We describe and evaluate different methods for comparative opinion summarization. Three methods are brought from previous work and one is created. The input for tests consists of reviews about consumer electronic products written in Portuguese and extracted from the Web. Although there are some previously published methods, there was no study comparing them: the methods were tested on different datasets and evaluated with different metrics. Assuming that the methods will generate summaries with different characteristics for the same dataset, this paper fills this gap by building a diverse dataset and defining standardized metrics to test desirable characteristics of summaries generated by each method. Automatic summarization is important because it allows the development of tools that help users to better absorb information from a set of texts. This is especially useful if the set is too large, such as batch data collected from the Internet. Comparative opinion summarization reaches a more specific part of the problem: the case where a user wants to compare two entities based on a large volume of text that contains other peoples opinions. This research leads to a survey on how useful summaries generated by different methods are. We hypothesize that they are more effective than single-entity opinion summaries to help people understand differences between two entities. This can be beneficial for a person who wants to buy a product and is in doubt between two brands or two models. It can also be useful for a manufacturer to understand how their products rank in relation to their competitors according to popular opinion. We expect this research brings contributions both in the academic context and in the practical context. From the practical point of view, it has the potential to enable the development of tools that companies and users demand. In the academy, it will join recent research initiatives in Natural Language Processing and Opinion Mining that have gained prominence in Brazil; this project will proceed their work and bring new ideas that may be used in the future by other researchers.Biblioteca Digitais de Teses e Dissertações da USPPardo, Thiago Alexandre SalgueiroSilva, Raphael Rocha da2019-11-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-04022020-154902/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-02-04T20:54:01Zoai:teses.usp.br:tde-04022020-154902Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-02-04T20:54:01Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Sumarização contrastiva de opinião Contrastive Opinion Summarization |
title |
Sumarização contrastiva de opinião |
spellingShingle |
Sumarização contrastiva de opinião Silva, Raphael Rocha da Contrastive opinion Summarization Natural language processing Processamento de linguagem natural Sumarização Contrastiva de opinião |
title_short |
Sumarização contrastiva de opinião |
title_full |
Sumarização contrastiva de opinião |
title_fullStr |
Sumarização contrastiva de opinião |
title_full_unstemmed |
Sumarização contrastiva de opinião |
title_sort |
Sumarização contrastiva de opinião |
author |
Silva, Raphael Rocha da |
author_facet |
Silva, Raphael Rocha da |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pardo, Thiago Alexandre Salgueiro |
dc.contributor.author.fl_str_mv |
Silva, Raphael Rocha da |
dc.subject.por.fl_str_mv |
Contrastive opinion Summarization Natural language processing Processamento de linguagem natural Sumarização Contrastiva de opinião |
topic |
Contrastive opinion Summarization Natural language processing Processamento de linguagem natural Sumarização Contrastiva de opinião |
description |
Esta dissertação apresenta métodos que permitem comparar entidades por meio da geração de um resumo que realce diferenças entre elas a partir do processamento automático de textos opinativos. Métodos de sumarização contrastiva de opinião foram descritos e avaliados. Três métodos foram trazidos da literatura e um método foi criado. Os métodos foram testados em textos opinativos pré-anotados sobre eletrônicos de uso pessoal extraídos da Web. Embora existam alguns métodos publicados anteriormente, não houve um estudo que os compare: os métodos foram testados em conjuntos de dados diferentes e avaliados com métricas diferentes. Partindo da hipótese que os métodos gerarão sumários com características diferentes para um mesmo conjunto de dados, este trabalho busca suprir essa lacuna montando um conjunto de dados diversificado e definindo métricas padronizadas para testar características desejáveis dos sumários gerados por cada método. A importância da sumarização automática se dá porque ela permite o desenvolvimento de ferramentas que ajudam usuários a absorver melhor as informações de um conjunto de texto, especialmente se esse conjunto for muito grande, como ocorre com dados coletados em massa da Internet. A sumarização contrastiva de opinião toca uma parte mais específica do problema: o caso em que um usuário deseja comparar duas entidades a partir de um grande volume de textos opinativos. Esta pesquisa permite identificar quanto os resumos gerados por diferentes métodos são úteis para os usuários; conjectura-se que eles são mais eficazes do que resumos de opinião simples na tarefa de ajudar as pessoas a entender diferenças entre duas entidades. Isso pode ser benéfico para uma pessoa que quer comprar um produto e está em dúvida entre duas marcas ou dois modelos. Também pode ser útil para um fabricante entender como seus produtos se posicionam segundo a opinião popular em relação a seus concorrentes. Espera-se que esta pesquisa traga contribuições tanto no âmbito acadêmico quanto no contexto prático. Do ponto de vista prático, ela tem o potencial de permitir o desenvolvimento de ferramentas as quais empresas e usuários demandam. Na academia, ela se unirá às iniciativas recentes de pesquisa em Processamento de Linguagem Natural e Mineração de Opinião que têm ganhado destaque no Brasil, dando continuidade a seus trabalhos e somando a elas ideias novas que poderão ser futuramente utilizadas por outros pesquisadores. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-11-01 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-04022020-154902/ |
url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-04022020-154902/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256649468739584 |