Classificação automática de discursos de ódio em textos do twitter

Nascimento, Robson Murilo Ferreira do

Classificação automática de discursos de ódio em textos do twitter

Detalhes bibliográficos
Autor(a) principal:	Nascimento, Robson Murilo Ferreira do
Data de Publicação:	2019
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE)
Texto Completo:	https://repository.ufrpe.br/handle/123456789/2439
Resumo:	Discurso do ódio, ou no inglês Hate Speech, pode ser definido como qualquer ato de comunicação que inferiorize uma pessoa por sua etnia, raça, religião, orientação sexual, nacionalidade ou outras características. Esse ato está se tornando cada vez mais comum nas redes sociais, onde muitas pessoas confundem liberdade de expressão com intolerância. Os jovens são os principais afetados, pois representam um grupo mais fácil de ser atingido pela ideologia propagada pelos Haters, os quais exaltam a violência, adotam ideologias racistas e xenofóbicas, intolerância religiosa e etc. Uma ferramenta capaz de ajudar a combater esse problema, é a Mineração de Texto, que busca extrair regularidades, padrões ou tendências de textos em linguagem natural, assim podendo ser definida como um método de extração de informações relevantes em bases de dados não estruturadas ou semi-estruturadas. Considerando o Twitter como uma das redes sociais mais utilizadas no Brasil, este trabalho tem como objetivo de implementar e avaliar técnicas supervisionadas de aprendizagem de máquina, com intuito de identificar de forma automática discurso de ódio em tweets. Para isso, foram utilizados dois corpus, um na língua inglesa, previamente disponibilizado, e outro com a língua português do Brasil,o qual foi montado com texto do Twitter, que posteriormente parte dele foi anotado de forma manual, e ambos passaram por um pré-processamento, a fim de criar coleções douradas, utilizadas para construção e avaliação dos modelos supervisionados. Por fim, foi realizada uma análise comparativa dos algoritmos de aprendizagem de máquina: SVM, Naive-Bayse e Regressão Logística, combinados com a técnica de processamento de linguagem natural stemming.

Metadados do item

id	UFRPE_d3e7a254e6b6d439c4d79d75280f702d
oai_identifier_str	oai:dspace:123456789/2439
network_acronym_str	UFRPE
network_name_str	Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE)
repository_id_str	https://v2.sherpa.ac.uk/id/repository/10612
spelling	Classificação automática de discursos de ódio em textos do twitterTwitter (Rede social on-line)Discurso de ódio na InternetRedes sociais on-lineMineração de dados (Computação)Discurso do ódio, ou no inglês Hate Speech, pode ser definido como qualquer ato de comunicação que inferiorize uma pessoa por sua etnia, raça, religião, orientação sexual, nacionalidade ou outras características. Esse ato está se tornando cada vez mais comum nas redes sociais, onde muitas pessoas confundem liberdade de expressão com intolerância. Os jovens são os principais afetados, pois representam um grupo mais fácil de ser atingido pela ideologia propagada pelos Haters, os quais exaltam a violência, adotam ideologias racistas e xenofóbicas, intolerância religiosa e etc. Uma ferramenta capaz de ajudar a combater esse problema, é a Mineração de Texto, que busca extrair regularidades, padrões ou tendências de textos em linguagem natural, assim podendo ser definida como um método de extração de informações relevantes em bases de dados não estruturadas ou semi-estruturadas. Considerando o Twitter como uma das redes sociais mais utilizadas no Brasil, este trabalho tem como objetivo de implementar e avaliar técnicas supervisionadas de aprendizagem de máquina, com intuito de identificar de forma automática discurso de ódio em tweets. Para isso, foram utilizados dois corpus, um na língua inglesa, previamente disponibilizado, e outro com a língua português do Brasil,o qual foi montado com texto do Twitter, que posteriormente parte dele foi anotado de forma manual, e ambos passaram por um pré-processamento, a fim de criar coleções douradas, utilizadas para construção e avaliação dos modelos supervisionados. Por fim, foi realizada uma análise comparativa dos algoritmos de aprendizagem de máquina: SVM, Naive-Bayse e Regressão Logística, combinados com a técnica de processamento de linguagem natural stemming.Hate Speech can be defined as any communication that denigrates a person by their ethnicity, race, religion, sexual orientation, nationality or other characteristics. This behavior is becoming increasingly common in social networks, where many people confuse freedom of expression with intolerance. Young people are the main users affected since they represent a portion which might be easier to be influenced by the ideology propagated by haters, which in turn spread violence, racism, xenophobia, religious intolerance, etc. The tool that might help to handle this issue is Text Mining, which is capable of capture patterns or trends of texts in natural language. This task can be defined as a method of extracting relevant information in unstructured databases or semi-structured. Given that the Twitter is one of the most used social networks in Brazil, this work aims to implement and evaluate supervised machine learning techniques in order to automatically identify hate speech in tweets. With that in mind, we build a corpus with data collected from Twitter and part of it is manually annotated and subsequently preprocessed so we can obtain the ground truth collection used for training and evaluation of the supervised models. Finally, we conduct a comparison between machine learning algorithms, namely the SVM, Naive-Bayes and Logistic Regression. Later, we identify the best model under the described domain.BrasilSouza, Ellen Polliana Ramoshttp://lattes.cnpq.br/8962852253787699http://lattes.cnpq.br/6593918610781356Nascimento, Robson Murilo Ferreira do2020-07-22T20:03:04Z2020-07-22T20:03:04Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis47 f.application/pdfNASCIMENTO, Robson Murilo Ferreira do. Classificação automática de discursos de ódio em textos do twitter. 2019. 47 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Unidade Acadêmica de Serra Talhada, Universidade Federal Rural de Pernambuco, Serra Talhada, 2019.https://repository.ufrpe.br/handle/123456789/2439porAtribuição-NãoComercial-CompartilhaIgual 4.0 Internacional (CC BY-NC-SA 4.0)https://creativecommons.org/licenses/by-nc-sa/4.0/deed.pt_BRopenAccessinfo:eu-repo/semantics/openAccessreponame:Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE)instname:Universidade Federal Rural de Pernambuco (UFRPE)instacron:UFRPE2022-05-10T20:40:47Zoai:dspace:123456789/2439Repositório InstitucionalPUBhttps://repository.ufrpe.br/oai/requestrepositorio.sib@ufrpe.bropendoar:https://v2.sherpa.ac.uk/id/repository/106122022-05-10T20:40:47Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE) - Universidade Federal Rural de Pernambuco (UFRPE)false
dc.title.none.fl_str_mv	Classificação automática de discursos de ódio em textos do twitter
title	Classificação automática de discursos de ódio em textos do twitter
spellingShingle	Classificação automática de discursos de ódio em textos do twitter Nascimento, Robson Murilo Ferreira do Twitter (Rede social on-line) Discurso de ódio na Internet Redes sociais on-line Mineração de dados (Computação)
title_short	Classificação automática de discursos de ódio em textos do twitter
title_full	Classificação automática de discursos de ódio em textos do twitter
title_fullStr	Classificação automática de discursos de ódio em textos do twitter
title_full_unstemmed	Classificação automática de discursos de ódio em textos do twitter
title_sort	Classificação automática de discursos de ódio em textos do twitter
author	Nascimento, Robson Murilo Ferreira do
author_facet	Nascimento, Robson Murilo Ferreira do
author_role	author
dc.contributor.none.fl_str_mv	Souza, Ellen Polliana Ramos http://lattes.cnpq.br/8962852253787699 http://lattes.cnpq.br/6593918610781356
dc.contributor.author.fl_str_mv	Nascimento, Robson Murilo Ferreira do
dc.subject.por.fl_str_mv	Twitter (Rede social on-line) Discurso de ódio na Internet Redes sociais on-line Mineração de dados (Computação)
topic	Twitter (Rede social on-line) Discurso de ódio na Internet Redes sociais on-line Mineração de dados (Computação)
description	Discurso do ódio, ou no inglês Hate Speech, pode ser definido como qualquer ato de comunicação que inferiorize uma pessoa por sua etnia, raça, religião, orientação sexual, nacionalidade ou outras características. Esse ato está se tornando cada vez mais comum nas redes sociais, onde muitas pessoas confundem liberdade de expressão com intolerância. Os jovens são os principais afetados, pois representam um grupo mais fácil de ser atingido pela ideologia propagada pelos Haters, os quais exaltam a violência, adotam ideologias racistas e xenofóbicas, intolerância religiosa e etc. Uma ferramenta capaz de ajudar a combater esse problema, é a Mineração de Texto, que busca extrair regularidades, padrões ou tendências de textos em linguagem natural, assim podendo ser definida como um método de extração de informações relevantes em bases de dados não estruturadas ou semi-estruturadas. Considerando o Twitter como uma das redes sociais mais utilizadas no Brasil, este trabalho tem como objetivo de implementar e avaliar técnicas supervisionadas de aprendizagem de máquina, com intuito de identificar de forma automática discurso de ódio em tweets. Para isso, foram utilizados dois corpus, um na língua inglesa, previamente disponibilizado, e outro com a língua português do Brasil,o qual foi montado com texto do Twitter, que posteriormente parte dele foi anotado de forma manual, e ambos passaram por um pré-processamento, a fim de criar coleções douradas, utilizadas para construção e avaliação dos modelos supervisionados. Por fim, foi realizada uma análise comparativa dos algoritmos de aprendizagem de máquina: SVM, Naive-Bayse e Regressão Logística, combinados com a técnica de processamento de linguagem natural stemming.
publishDate	2019
dc.date.none.fl_str_mv	2019 2020-07-22T20:03:04Z 2020-07-22T20:03:04Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	NASCIMENTO, Robson Murilo Ferreira do. Classificação automática de discursos de ódio em textos do twitter. 2019. 47 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Unidade Acadêmica de Serra Talhada, Universidade Federal Rural de Pernambuco, Serra Talhada, 2019. https://repository.ufrpe.br/handle/123456789/2439
identifier_str_mv	NASCIMENTO, Robson Murilo Ferreira do. Classificação automática de discursos de ódio em textos do twitter. 2019. 47 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Unidade Acadêmica de Serra Talhada, Universidade Federal Rural de Pernambuco, Serra Talhada, 2019.
url	https://repository.ufrpe.br/handle/123456789/2439
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	Atribuição-NãoComercial-CompartilhaIgual 4.0 Internacional (CC BY-NC-SA 4.0) https://creativecommons.org/licenses/by-nc-sa/4.0/deed.pt_BR openAccess info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Atribuição-NãoComercial-CompartilhaIgual 4.0 Internacional (CC BY-NC-SA 4.0) https://creativecommons.org/licenses/by-nc-sa/4.0/deed.pt_BR openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	47 f. application/pdf
dc.publisher.none.fl_str_mv	Brasil
publisher.none.fl_str_mv	Brasil
dc.source.none.fl_str_mv	reponame:Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE) instname:Universidade Federal Rural de Pernambuco (UFRPE) instacron:UFRPE
instname_str	Universidade Federal Rural de Pernambuco (UFRPE)
instacron_str	UFRPE
institution	UFRPE
reponame_str	Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE)
collection	Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE)
repository.name.fl_str_mv	Repositório institucional da Universidade Federal Rural de Pernambuco (UFRPE) (RI-UFRPE) - Universidade Federal Rural de Pernambuco (UFRPE)
repository.mail.fl_str_mv	repositorio.sib@ufrpe.br
_version_	1809277170578620416

Classificação automática de discursos de ódio em textos do twitter

Registros relacionados