Extração de características para identificação de discurso de ódio em documentos

Detalhes bibliográficos
Autor(a) principal: Pinto, Cleiton de Lima
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFFS (Repositório Digital da UFFS)
Texto Completo: https://rd.uffs.edu.br/handle/prefix/2689
Resumo: As mídias sociais estão cada vez mais presentes na vida das pessoas, incluindo ferramentas que permitem que usuário colabore com a criação do conteúdo nela exposto. Muitos usuários se aproveitam dessa funcionalidade para disseminar conteúdo ilícito ou criminoso. Caso não seja removido, este conteúdo será visto por cada vez mais pessoas e poderá ser propagado pela internet, atingindo um número maior de vítimas e incentivando a ocorrência de outros crimes. Esse tipo de crime geralmente é voltado aos grupos mais vulneráveis da sociedade, e seus efeitos nocivos podem causar o aumento da exclusão social e da violência praticada contra esses grupos. Este trabalho propõe explorar e extrair características de textos utilizando técnicas de processamento de linguagem natural e aprendizado de máquina para detectar automaticamente discursos de ódio. Os experimentos demonstraram que o método foi capaz de melhorar em até 5% em relação ao método base.
id UFFS_acd8737f5732b2b2a1cdb411ca78cbf7
oai_identifier_str oai:rd.uffs.edu.br:prefix/2689
network_acronym_str UFFS
network_name_str Repositório Institucional da UFFS (Repositório Digital da UFFS)
repository_id_str 3924
spelling Dal Bianco, GuilhermePinto, Cleiton de Lima20182019-04-04T17:55:23Z20192019-04-04T17:55:23Z2018https://rd.uffs.edu.br/handle/prefix/2689As mídias sociais estão cada vez mais presentes na vida das pessoas, incluindo ferramentas que permitem que usuário colabore com a criação do conteúdo nela exposto. Muitos usuários se aproveitam dessa funcionalidade para disseminar conteúdo ilícito ou criminoso. Caso não seja removido, este conteúdo será visto por cada vez mais pessoas e poderá ser propagado pela internet, atingindo um número maior de vítimas e incentivando a ocorrência de outros crimes. Esse tipo de crime geralmente é voltado aos grupos mais vulneráveis da sociedade, e seus efeitos nocivos podem causar o aumento da exclusão social e da violência praticada contra esses grupos. Este trabalho propõe explorar e extrair características de textos utilizando técnicas de processamento de linguagem natural e aprendizado de máquina para detectar automaticamente discursos de ódio. Os experimentos demonstraram que o método foi capaz de melhorar em até 5% em relação ao método base.Social media is increasingly present in people’s lives, including tools that allow users to collaborate with the creation of the content exposed in it. Many users use this functionality to post texts spreading illicit or criminal content. This offensive content need be removed soon as possible otherwise more and more people we see and can propagate through the internet, reaching a more significant number of victims encouraging the occurrence of other crimes. Thisworkproposestheextractionofcharacteristicsfromtextusingnaturallanguageprocessing techniques and machine learning to detect hate speech automatically. This type of hate crime, in general, is focused on the most vulnerable groups in society, and the harmful effects can lead to increased social exclusion and violence against such groups.Submitted by SUELEN SPINDOLA BILHAR (suelen.bilhar@gmail.com) on 2019-04-04T16:42:39Z No. of bitstreams: 1 PINTO.pdf: 1976781 bytes, checksum: 18aeebaa799fb9a792993ebd78146dd6 (MD5)Approved for entry into archive by Diego dos Santos Borba (dborba@uffs.edu.br) on 2019-04-04T17:55:23Z (GMT) No. of bitstreams: 1 PINTO.pdf: 1976781 bytes, checksum: 18aeebaa799fb9a792993ebd78146dd6 (MD5)Made available in DSpace on 2019-04-04T17:55:23Z (GMT). No. of bitstreams: 1 PINTO.pdf: 1976781 bytes, checksum: 18aeebaa799fb9a792993ebd78146dd6 (MD5) Previous issue date: 2018porUniversidade Federal da Fronteira SulUFFSBrasilCampus ChapecóProcessamento de linguagem naturalAprendizado computacionalInternetExtração de características para identificação de discurso de ódio em documentosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFFS (Repositório Digital da UFFS)instname:Universidade Federal Fronteira do Sul (UFFS)instacron:UFFSLICENSElicense.txtlicense.txttext/plain; charset=utf-81866https://rd.uffs.edu.br:8443/bitstream/prefix/2689/2/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD52ORIGINALPINTO.pdfPINTO.pdfapplication/pdf1976781https://rd.uffs.edu.br:8443/bitstream/prefix/2689/1/PINTO.pdf18aeebaa799fb9a792993ebd78146dd6MD51prefix/26892019-04-04 14:55:23.307oai:rd.uffs.edu.br:prefix/2689TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório InstitucionalPUBhttps://rd.uffs.edu.br/oai/requestopendoar:39242019-04-04T17:55:23Repositório Institucional da UFFS (Repositório Digital da UFFS) - Universidade Federal Fronteira do Sul (UFFS)false
dc.title.pt_BR.fl_str_mv Extração de características para identificação de discurso de ódio em documentos
title Extração de características para identificação de discurso de ódio em documentos
spellingShingle Extração de características para identificação de discurso de ódio em documentos
Pinto, Cleiton de Lima
Processamento de linguagem natural
Aprendizado computacional
Internet
title_short Extração de características para identificação de discurso de ódio em documentos
title_full Extração de características para identificação de discurso de ódio em documentos
title_fullStr Extração de características para identificação de discurso de ódio em documentos
title_full_unstemmed Extração de características para identificação de discurso de ódio em documentos
title_sort Extração de características para identificação de discurso de ódio em documentos
author Pinto, Cleiton de Lima
author_facet Pinto, Cleiton de Lima
author_role author
dc.contributor.advisor1.fl_str_mv Dal Bianco, Guilherme
dc.contributor.author.fl_str_mv Pinto, Cleiton de Lima
contributor_str_mv Dal Bianco, Guilherme
dc.subject.por.fl_str_mv Processamento de linguagem natural
Aprendizado computacional
Internet
topic Processamento de linguagem natural
Aprendizado computacional
Internet
description As mídias sociais estão cada vez mais presentes na vida das pessoas, incluindo ferramentas que permitem que usuário colabore com a criação do conteúdo nela exposto. Muitos usuários se aproveitam dessa funcionalidade para disseminar conteúdo ilícito ou criminoso. Caso não seja removido, este conteúdo será visto por cada vez mais pessoas e poderá ser propagado pela internet, atingindo um número maior de vítimas e incentivando a ocorrência de outros crimes. Esse tipo de crime geralmente é voltado aos grupos mais vulneráveis da sociedade, e seus efeitos nocivos podem causar o aumento da exclusão social e da violência praticada contra esses grupos. Este trabalho propõe explorar e extrair características de textos utilizando técnicas de processamento de linguagem natural e aprendizado de máquina para detectar automaticamente discursos de ódio. Os experimentos demonstraram que o método foi capaz de melhorar em até 5% em relação ao método base.
publishDate 2018
dc.date.none.fl_str_mv 2018
dc.date.issued.fl_str_mv 2018
dc.date.accessioned.fl_str_mv 2019-04-04T17:55:23Z
dc.date.available.fl_str_mv 2019
2019-04-04T17:55:23Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://rd.uffs.edu.br/handle/prefix/2689
url https://rd.uffs.edu.br/handle/prefix/2689
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Fronteira Sul
dc.publisher.initials.fl_str_mv UFFS
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Campus Chapecó
publisher.none.fl_str_mv Universidade Federal da Fronteira Sul
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFFS (Repositório Digital da UFFS)
instname:Universidade Federal Fronteira do Sul (UFFS)
instacron:UFFS
instname_str Universidade Federal Fronteira do Sul (UFFS)
instacron_str UFFS
institution UFFS
reponame_str Repositório Institucional da UFFS (Repositório Digital da UFFS)
collection Repositório Institucional da UFFS (Repositório Digital da UFFS)
bitstream.url.fl_str_mv https://rd.uffs.edu.br:8443/bitstream/prefix/2689/2/license.txt
https://rd.uffs.edu.br:8443/bitstream/prefix/2689/1/PINTO.pdf
bitstream.checksum.fl_str_mv 43cd690d6a359e86c1fe3d5b7cba0c9b
18aeebaa799fb9a792993ebd78146dd6
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFFS (Repositório Digital da UFFS) - Universidade Federal Fronteira do Sul (UFFS)
repository.mail.fl_str_mv
_version_ 1809094609510334464