Sumarização contrastiva de opinião

Silva, Raphael Rocha da

Sumarização contrastiva de opinião

Detalhes bibliográficos
Autor(a) principal:	Silva, Raphael Rocha da
Data de Publicação:	2019
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da USP
Texto Completo:	https://www.teses.usp.br/teses/disponiveis/55/55134/tde-04022020-154902/
Resumo:	Esta dissertação apresenta métodos que permitem comparar entidades por meio da geração de um resumo que realce diferenças entre elas a partir do processamento automático de textos opinativos. Métodos de sumarização contrastiva de opinião foram descritos e avaliados. Três métodos foram trazidos da literatura e um método foi criado. Os métodos foram testados em textos opinativos pré-anotados sobre eletrônicos de uso pessoal extraídos da Web. Embora existam alguns métodos publicados anteriormente, não houve um estudo que os compare: os métodos foram testados em conjuntos de dados diferentes e avaliados com métricas diferentes. Partindo da hipótese que os métodos gerarão sumários com características diferentes para um mesmo conjunto de dados, este trabalho busca suprir essa lacuna montando um conjunto de dados diversificado e definindo métricas padronizadas para testar características desejáveis dos sumários gerados por cada método. A importância da sumarização automática se dá porque ela permite o desenvolvimento de ferramentas que ajudam usuários a absorver melhor as informações de um conjunto de texto, especialmente se esse conjunto for muito grande, como ocorre com dados coletados em massa da Internet. A sumarização contrastiva de opinião toca uma parte mais específica do problema: o caso em que um usuário deseja comparar duas entidades a partir de um grande volume de textos opinativos. Esta pesquisa permite identificar quanto os resumos gerados por diferentes métodos são úteis para os usuários; conjectura-se que eles são mais eficazes do que resumos de opinião simples na tarefa de ajudar as pessoas a entender diferenças entre duas entidades. Isso pode ser benéfico para uma pessoa que quer comprar um produto e está em dúvida entre duas marcas ou dois modelos. Também pode ser útil para um fabricante entender como seus produtos se posicionam segundo a opinião popular em relação a seus concorrentes. Espera-se que esta pesquisa traga contribuições tanto no âmbito acadêmico quanto no contexto prático. Do ponto de vista prático, ela tem o potencial de permitir o desenvolvimento de ferramentas as quais empresas e usuários demandam. Na academia, ela se unirá às iniciativas recentes de pesquisa em Processamento de Linguagem Natural e Mineração de Opinião que têm ganhado destaque no Brasil, dando continuidade a seus trabalhos e somando a elas ideias novas que poderão ser futuramente utilizadas por outros pesquisadores.

Metadados do item

id	USP_85fc12ea9718e64c3642ee7b9d9770cb
oai_identifier_str	oai:teses.usp.br:tde-04022020-154902
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str	2721
spelling	Sumarização contrastiva de opiniãoContrastive Opinion SummarizationContrastive opinion SummarizationNatural language processingProcessamento de linguagem naturalSumarização Contrastiva de opiniãoEsta dissertação apresenta métodos que permitem comparar entidades por meio da geração de um resumo que realce diferenças entre elas a partir do processamento automático de textos opinativos. Métodos de sumarização contrastiva de opinião foram descritos e avaliados. Três métodos foram trazidos da literatura e um método foi criado. Os métodos foram testados em textos opinativos pré-anotados sobre eletrônicos de uso pessoal extraídos da Web. Embora existam alguns métodos publicados anteriormente, não houve um estudo que os compare: os métodos foram testados em conjuntos de dados diferentes e avaliados com métricas diferentes. Partindo da hipótese que os métodos gerarão sumários com características diferentes para um mesmo conjunto de dados, este trabalho busca suprir essa lacuna montando um conjunto de dados diversificado e definindo métricas padronizadas para testar características desejáveis dos sumários gerados por cada método. A importância da sumarização automática se dá porque ela permite o desenvolvimento de ferramentas que ajudam usuários a absorver melhor as informações de um conjunto de texto, especialmente se esse conjunto for muito grande, como ocorre com dados coletados em massa da Internet. A sumarização contrastiva de opinião toca uma parte mais específica do problema: o caso em que um usuário deseja comparar duas entidades a partir de um grande volume de textos opinativos. Esta pesquisa permite identificar quanto os resumos gerados por diferentes métodos são úteis para os usuários; conjectura-se que eles são mais eficazes do que resumos de opinião simples na tarefa de ajudar as pessoas a entender diferenças entre duas entidades. Isso pode ser benéfico para uma pessoa que quer comprar um produto e está em dúvida entre duas marcas ou dois modelos. Também pode ser útil para um fabricante entender como seus produtos se posicionam segundo a opinião popular em relação a seus concorrentes. Espera-se que esta pesquisa traga contribuições tanto no âmbito acadêmico quanto no contexto prático. Do ponto de vista prático, ela tem o potencial de permitir o desenvolvimento de ferramentas as quais empresas e usuários demandam. Na academia, ela se unirá às iniciativas recentes de pesquisa em Processamento de Linguagem Natural e Mineração de Opinião que têm ganhado destaque no Brasil, dando continuidade a seus trabalhos e somando a elas ideias novas que poderão ser futuramente utilizadas por outros pesquisadores.This theses presents automatic techniques for comparing opinions by generating summaries that highlight differences and similarities between two entities given a set of opinionated text. We describe and evaluate different methods for comparative opinion summarization. Three methods are brought from previous work and one is created. The input for tests consists of reviews about consumer electronic products written in Portuguese and extracted from the Web. Although there are some previously published methods, there was no study comparing them: the methods were tested on different datasets and evaluated with different metrics. Assuming that the methods will generate summaries with different characteristics for the same dataset, this paper fills this gap by building a diverse dataset and defining standardized metrics to test desirable characteristics of summaries generated by each method. Automatic summarization is important because it allows the development of tools that help users to better absorb information from a set of texts. This is especially useful if the set is too large, such as batch data collected from the Internet. Comparative opinion summarization reaches a more specific part of the problem: the case where a user wants to compare two entities based on a large volume of text that contains other peoples opinions. This research leads to a survey on how useful summaries generated by different methods are. We hypothesize that they are more effective than single-entity opinion summaries to help people understand differences between two entities. This can be beneficial for a person who wants to buy a product and is in doubt between two brands or two models. It can also be useful for a manufacturer to understand how their products rank in relation to their competitors according to popular opinion. We expect this research brings contributions both in the academic context and in the practical context. From the practical point of view, it has the potential to enable the development of tools that companies and users demand. In the academy, it will join recent research initiatives in Natural Language Processing and Opinion Mining that have gained prominence in Brazil; this project will proceed their work and bring new ideas that may be used in the future by other researchers.Biblioteca Digitais de Teses e Dissertações da USPPardo, Thiago Alexandre SalgueiroSilva, Raphael Rocha da2019-11-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-04022020-154902/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-02-04T20:54:01Zoai:teses.usp.br:tde-04022020-154902Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212020-02-04T20:54:01Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Sumarização contrastiva de opinião Contrastive Opinion Summarization
title	Sumarização contrastiva de opinião
spellingShingle	Sumarização contrastiva de opinião Silva, Raphael Rocha da Contrastive opinion Summarization Natural language processing Processamento de linguagem natural Sumarização Contrastiva de opinião
title_short	Sumarização contrastiva de opinião
title_full	Sumarização contrastiva de opinião
title_fullStr	Sumarização contrastiva de opinião
title_full_unstemmed	Sumarização contrastiva de opinião
title_sort	Sumarização contrastiva de opinião
author	Silva, Raphael Rocha da
author_facet	Silva, Raphael Rocha da
author_role	author
dc.contributor.none.fl_str_mv	Pardo, Thiago Alexandre Salgueiro
dc.contributor.author.fl_str_mv	Silva, Raphael Rocha da
dc.subject.por.fl_str_mv	Contrastive opinion Summarization Natural language processing Processamento de linguagem natural Sumarização Contrastiva de opinião
topic	Contrastive opinion Summarization Natural language processing Processamento de linguagem natural Sumarização Contrastiva de opinião
description	Esta dissertação apresenta métodos que permitem comparar entidades por meio da geração de um resumo que realce diferenças entre elas a partir do processamento automático de textos opinativos. Métodos de sumarização contrastiva de opinião foram descritos e avaliados. Três métodos foram trazidos da literatura e um método foi criado. Os métodos foram testados em textos opinativos pré-anotados sobre eletrônicos de uso pessoal extraídos da Web. Embora existam alguns métodos publicados anteriormente, não houve um estudo que os compare: os métodos foram testados em conjuntos de dados diferentes e avaliados com métricas diferentes. Partindo da hipótese que os métodos gerarão sumários com características diferentes para um mesmo conjunto de dados, este trabalho busca suprir essa lacuna montando um conjunto de dados diversificado e definindo métricas padronizadas para testar características desejáveis dos sumários gerados por cada método. A importância da sumarização automática se dá porque ela permite o desenvolvimento de ferramentas que ajudam usuários a absorver melhor as informações de um conjunto de texto, especialmente se esse conjunto for muito grande, como ocorre com dados coletados em massa da Internet. A sumarização contrastiva de opinião toca uma parte mais específica do problema: o caso em que um usuário deseja comparar duas entidades a partir de um grande volume de textos opinativos. Esta pesquisa permite identificar quanto os resumos gerados por diferentes métodos são úteis para os usuários; conjectura-se que eles são mais eficazes do que resumos de opinião simples na tarefa de ajudar as pessoas a entender diferenças entre duas entidades. Isso pode ser benéfico para uma pessoa que quer comprar um produto e está em dúvida entre duas marcas ou dois modelos. Também pode ser útil para um fabricante entender como seus produtos se posicionam segundo a opinião popular em relação a seus concorrentes. Espera-se que esta pesquisa traga contribuições tanto no âmbito acadêmico quanto no contexto prático. Do ponto de vista prático, ela tem o potencial de permitir o desenvolvimento de ferramentas as quais empresas e usuários demandam. Na academia, ela se unirá às iniciativas recentes de pesquisa em Processamento de Linguagem Natural e Mineração de Opinião que têm ganhado destaque no Brasil, dando continuidade a seus trabalhos e somando a elas ideias novas que poderão ser futuramente utilizadas por outros pesquisadores.
publishDate	2019
dc.date.none.fl_str_mv	2019-11-01
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://www.teses.usp.br/teses/disponiveis/55/55134/tde-04022020-154902/
url	https://www.teses.usp.br/teses/disponiveis/55/55134/tde-04022020-154902/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1815256649468739584

Sumarização contrastiva de opinião

Registros relacionados