Estudo de modelos distribucionais para detecção de discurso de ódio em português
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/100/100131/tde-28012022-074813/ |
Resumo: | Com o surgimento das redes sociais, os usuários passaram de consumidores a produtores de conteúdo, sendo que qualquer usuário tem a liberdade de emitir sua opinião. Devido à grande quantidade de conteúdo que os usuários publicam nas redes sociais, torna-se impossível que o monitoramento seja feito por agente humano, portanto é necessário encontrar uma forma para que essa supervisão seja de forma automática. Entretanto, esse problema é pouco explorado para o português, sendo que a maioria das pesquisas são dedicadas ao idioma inglês. Além disso, os modelos distribucionais podem ser utilizados em diversas tarefas, inclusive na tarefa de identicação de discurso de ódio em tweets. Nos experimentos realizados nesta pesquisa, esses modelos obtiveram desempenho superior em relação aos métodos tradicionais como N-Gram combinada com SVM |
id |
USP_1b0c47c0a254152955dd7f942bd8462f |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-28012022-074813 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Estudo de modelos distribucionais para detecção de discurso de ódio em portuguêsStudy of distributional models for the detection of hate speech in PortugueseDiscurso de ódioHate speechMineração de textoRedes sociaisSocial networksText miningCom o surgimento das redes sociais, os usuários passaram de consumidores a produtores de conteúdo, sendo que qualquer usuário tem a liberdade de emitir sua opinião. Devido à grande quantidade de conteúdo que os usuários publicam nas redes sociais, torna-se impossível que o monitoramento seja feito por agente humano, portanto é necessário encontrar uma forma para que essa supervisão seja de forma automática. Entretanto, esse problema é pouco explorado para o português, sendo que a maioria das pesquisas são dedicadas ao idioma inglês. Além disso, os modelos distribucionais podem ser utilizados em diversas tarefas, inclusive na tarefa de identicação de discurso de ódio em tweets. Nos experimentos realizados nesta pesquisa, esses modelos obtiveram desempenho superior em relação aos métodos tradicionais como N-Gram combinada com SVMWith the rise of social networks, users have gone from being consumers to content producers, and any user is free to express their opinion. Due to the large amount of content that users publish on social networks, it is impossible for monitoring to be carried out by a human agent, so it is necessary to find a way for this supervision to be automatic. However, this problem is little explored for Portuguese, as most of the research is dedicated to the English language. Furthermore, distributional models can be used in several tasks, including the task of identifying hate speech in tweets. In the experiments performed in this research, these models obtained superior performance compared to traditional methods such as N-Gram combined with SVMBiblioteca Digitais de Teses e Dissertações da USPRoman, Norton TrevisanSilva, Adriano dos Santos Rodrigues da2021-12-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100131/tde-28012022-074813/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-07-28T16:00:39Zoai:teses.usp.br:tde-28012022-074813Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-07-28T16:00:39Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Estudo de modelos distribucionais para detecção de discurso de ódio em português Study of distributional models for the detection of hate speech in Portuguese |
title |
Estudo de modelos distribucionais para detecção de discurso de ódio em português |
spellingShingle |
Estudo de modelos distribucionais para detecção de discurso de ódio em português Silva, Adriano dos Santos Rodrigues da Discurso de ódio Hate speech Mineração de texto Redes sociais Social networks Text mining |
title_short |
Estudo de modelos distribucionais para detecção de discurso de ódio em português |
title_full |
Estudo de modelos distribucionais para detecção de discurso de ódio em português |
title_fullStr |
Estudo de modelos distribucionais para detecção de discurso de ódio em português |
title_full_unstemmed |
Estudo de modelos distribucionais para detecção de discurso de ódio em português |
title_sort |
Estudo de modelos distribucionais para detecção de discurso de ódio em português |
author |
Silva, Adriano dos Santos Rodrigues da |
author_facet |
Silva, Adriano dos Santos Rodrigues da |
author_role |
author |
dc.contributor.none.fl_str_mv |
Roman, Norton Trevisan |
dc.contributor.author.fl_str_mv |
Silva, Adriano dos Santos Rodrigues da |
dc.subject.por.fl_str_mv |
Discurso de ódio Hate speech Mineração de texto Redes sociais Social networks Text mining |
topic |
Discurso de ódio Hate speech Mineração de texto Redes sociais Social networks Text mining |
description |
Com o surgimento das redes sociais, os usuários passaram de consumidores a produtores de conteúdo, sendo que qualquer usuário tem a liberdade de emitir sua opinião. Devido à grande quantidade de conteúdo que os usuários publicam nas redes sociais, torna-se impossível que o monitoramento seja feito por agente humano, portanto é necessário encontrar uma forma para que essa supervisão seja de forma automática. Entretanto, esse problema é pouco explorado para o português, sendo que a maioria das pesquisas são dedicadas ao idioma inglês. Além disso, os modelos distribucionais podem ser utilizados em diversas tarefas, inclusive na tarefa de identicação de discurso de ódio em tweets. Nos experimentos realizados nesta pesquisa, esses modelos obtiveram desempenho superior em relação aos métodos tradicionais como N-Gram combinada com SVM |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-12-21 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-28012022-074813/ |
url |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-28012022-074813/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1809091141117673472 |