Inteligência semiótica e TripAdvisor: deep learning e quantificações subjetivas na análise dos discursos de sanção de restaurante

Detalhes bibliográficos
Autor(a) principal: Silva, Túlio Ferreira Leite da
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/8/8139/tde-18052021-175948/
Resumo: Uma realidade em que internet móvel 5G estará disponível em qualquer lugar do planeta bate à porta. Se a tecnologia anterior (4G) foi diretamente responsável pela possibilidade da revolução causada por Waze, Uber e iFood, ainda não somos capazes de prever o cenário dos próximos anos. A única certeza que temos: haverá muito texto para processar. Nossa contribuição com esta pesquisa, portanto, é a de fornecer atualização a uma proposta dos anos 1980 de utilização da semiótica como ferramenta de representação do conhecimento a ser utilizado por inteligências artificiais no processamento de linguagem natural (PLN). Assim, partimos das contribuições heurísticas fornecidas pela Escola de Paris e de novidades propostas pelo francês Claude Zilberberg, criador da hipótese tensiva. Por meio desse aparato teórico, apresentamos uma análise da estrutura das avaliações de restaurante na plataforma TripAdvisor e propomos um modelo de classificação para colaborar como pré-processamento para a análise de sentimentos. A partir de um corpus manualmente anotado com essa nova proposta, utilizamos elementos do estado da arte em inteligência artificial para PLN (deep learning) e implementamos um sistema automático de classificação. O modelo, desenvolvido para fazer as vezes de prova de conceito, alcança mais de 90% de acurácia. Entretanto, não são poucas as evidências de que esteja havendo sobreajuste (overfitting). Novas pesquisas estão em andamento para sanar este ponto, ainda assim, todo o aparato teórico não é afetado pelos problemas técnicos. Mais do que isso, ainda debatemos neste trabalho formas de vencer tais dificuldades por meio da classificação de mais corpus.
id USP_f7425c796e84bcdab3ef83679a58790e
oai_identifier_str oai:teses.usp.br:tde-18052021-175948
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Inteligência semiótica e TripAdvisor: deep learning e quantificações subjetivas na análise dos discursos de sanção de restauranteSemiotic intelligence and TripAdvisor: deep learning and subjective quantifications in the discourse analysis of restaurants sanctionsAnálise de SentimentoAprendizado de MáquinaGastronomiaGastronomyMachine LearningNatural Language ProcessingProcessamento de Linguagem NaturalSemióticaSemioticsSentiment AnalysisUma realidade em que internet móvel 5G estará disponível em qualquer lugar do planeta bate à porta. Se a tecnologia anterior (4G) foi diretamente responsável pela possibilidade da revolução causada por Waze, Uber e iFood, ainda não somos capazes de prever o cenário dos próximos anos. A única certeza que temos: haverá muito texto para processar. Nossa contribuição com esta pesquisa, portanto, é a de fornecer atualização a uma proposta dos anos 1980 de utilização da semiótica como ferramenta de representação do conhecimento a ser utilizado por inteligências artificiais no processamento de linguagem natural (PLN). Assim, partimos das contribuições heurísticas fornecidas pela Escola de Paris e de novidades propostas pelo francês Claude Zilberberg, criador da hipótese tensiva. Por meio desse aparato teórico, apresentamos uma análise da estrutura das avaliações de restaurante na plataforma TripAdvisor e propomos um modelo de classificação para colaborar como pré-processamento para a análise de sentimentos. A partir de um corpus manualmente anotado com essa nova proposta, utilizamos elementos do estado da arte em inteligência artificial para PLN (deep learning) e implementamos um sistema automático de classificação. O modelo, desenvolvido para fazer as vezes de prova de conceito, alcança mais de 90% de acurácia. Entretanto, não são poucas as evidências de que esteja havendo sobreajuste (overfitting). Novas pesquisas estão em andamento para sanar este ponto, ainda assim, todo o aparato teórico não é afetado pelos problemas técnicos. Mais do que isso, ainda debatemos neste trabalho formas de vencer tais dificuldades por meio da classificação de mais corpus.Worldwide availability of 5G mobile internet is fast becoming a reality. If the previous technology (4G) was directly responsible for enabling the revolution of Waze, Uber and iFood, we still can\'t predict the next few years. The only certainty we have is that there\'ll be a whole lot of text to process. Our contribution with this research, therefore, is to update the 1980\'s proposal of using semiotics as a tool of knowledge representation to aid artificial intelligence in natural language processing (NLP). Thus, we start with the heuristical contributions provided by the School of Paris, and the new proposals from Claude Zilberberg, creator of the tensive hypothesis. By means of this theoretical apparatus, we present a structural analysis of restaurant reviews on the TripAdvisor platform, and we propose a classification model to colaborate with the pre-processing of sentiment analysis. From a corpus manually notated with this new proposal, we use state of the art elements in NLP artificial intelligence (deep learning) to implement an automatic classification system. The model, developed to stand as a proof of concept, reaches over 90% accuracy. However, there is no shortage of evidence of overfitting, which new ongoing research is working to remedy. Still, the theoretical apparatus remains unaffected by these technical issues. Beyond that, we debate in this paper manners of overcoming such difficulties through the classification of more texts.Biblioteca Digitais de Teses e Dissertações da USPBeividas, WaldirSilva, Túlio Ferreira Leite da2021-03-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/8/8139/tde-18052021-175948/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-05-18T12:58:54Zoai:teses.usp.br:tde-18052021-175948Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-05-18T12:58:54Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Inteligência semiótica e TripAdvisor: deep learning e quantificações subjetivas na análise dos discursos de sanção de restaurante
Semiotic intelligence and TripAdvisor: deep learning and subjective quantifications in the discourse analysis of restaurants sanctions
title Inteligência semiótica e TripAdvisor: deep learning e quantificações subjetivas na análise dos discursos de sanção de restaurante
spellingShingle Inteligência semiótica e TripAdvisor: deep learning e quantificações subjetivas na análise dos discursos de sanção de restaurante
Silva, Túlio Ferreira Leite da
Análise de Sentimento
Aprendizado de Máquina
Gastronomia
Gastronomy
Machine Learning
Natural Language Processing
Processamento de Linguagem Natural
Semiótica
Semiotics
Sentiment Analysis
title_short Inteligência semiótica e TripAdvisor: deep learning e quantificações subjetivas na análise dos discursos de sanção de restaurante
title_full Inteligência semiótica e TripAdvisor: deep learning e quantificações subjetivas na análise dos discursos de sanção de restaurante
title_fullStr Inteligência semiótica e TripAdvisor: deep learning e quantificações subjetivas na análise dos discursos de sanção de restaurante
title_full_unstemmed Inteligência semiótica e TripAdvisor: deep learning e quantificações subjetivas na análise dos discursos de sanção de restaurante
title_sort Inteligência semiótica e TripAdvisor: deep learning e quantificações subjetivas na análise dos discursos de sanção de restaurante
author Silva, Túlio Ferreira Leite da
author_facet Silva, Túlio Ferreira Leite da
author_role author
dc.contributor.none.fl_str_mv Beividas, Waldir
dc.contributor.author.fl_str_mv Silva, Túlio Ferreira Leite da
dc.subject.por.fl_str_mv Análise de Sentimento
Aprendizado de Máquina
Gastronomia
Gastronomy
Machine Learning
Natural Language Processing
Processamento de Linguagem Natural
Semiótica
Semiotics
Sentiment Analysis
topic Análise de Sentimento
Aprendizado de Máquina
Gastronomia
Gastronomy
Machine Learning
Natural Language Processing
Processamento de Linguagem Natural
Semiótica
Semiotics
Sentiment Analysis
description Uma realidade em que internet móvel 5G estará disponível em qualquer lugar do planeta bate à porta. Se a tecnologia anterior (4G) foi diretamente responsável pela possibilidade da revolução causada por Waze, Uber e iFood, ainda não somos capazes de prever o cenário dos próximos anos. A única certeza que temos: haverá muito texto para processar. Nossa contribuição com esta pesquisa, portanto, é a de fornecer atualização a uma proposta dos anos 1980 de utilização da semiótica como ferramenta de representação do conhecimento a ser utilizado por inteligências artificiais no processamento de linguagem natural (PLN). Assim, partimos das contribuições heurísticas fornecidas pela Escola de Paris e de novidades propostas pelo francês Claude Zilberberg, criador da hipótese tensiva. Por meio desse aparato teórico, apresentamos uma análise da estrutura das avaliações de restaurante na plataforma TripAdvisor e propomos um modelo de classificação para colaborar como pré-processamento para a análise de sentimentos. A partir de um corpus manualmente anotado com essa nova proposta, utilizamos elementos do estado da arte em inteligência artificial para PLN (deep learning) e implementamos um sistema automático de classificação. O modelo, desenvolvido para fazer as vezes de prova de conceito, alcança mais de 90% de acurácia. Entretanto, não são poucas as evidências de que esteja havendo sobreajuste (overfitting). Novas pesquisas estão em andamento para sanar este ponto, ainda assim, todo o aparato teórico não é afetado pelos problemas técnicos. Mais do que isso, ainda debatemos neste trabalho formas de vencer tais dificuldades por meio da classificação de mais corpus.
publishDate 2021
dc.date.none.fl_str_mv 2021-03-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/8/8139/tde-18052021-175948/
url https://www.teses.usp.br/teses/disponiveis/8/8139/tde-18052021-175948/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090830186577920