Extração de características para identificação de discurso de ódio em documentos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFFS (Repositório Digital da UFFS) |
Texto Completo: | https://rd.uffs.edu.br/handle/prefix/2689 |
Resumo: | As mídias sociais estão cada vez mais presentes na vida das pessoas, incluindo ferramentas que permitem que usuário colabore com a criação do conteúdo nela exposto. Muitos usuários se aproveitam dessa funcionalidade para disseminar conteúdo ilícito ou criminoso. Caso não seja removido, este conteúdo será visto por cada vez mais pessoas e poderá ser propagado pela internet, atingindo um número maior de vítimas e incentivando a ocorrência de outros crimes. Esse tipo de crime geralmente é voltado aos grupos mais vulneráveis da sociedade, e seus efeitos nocivos podem causar o aumento da exclusão social e da violência praticada contra esses grupos. Este trabalho propõe explorar e extrair características de textos utilizando técnicas de processamento de linguagem natural e aprendizado de máquina para detectar automaticamente discursos de ódio. Os experimentos demonstraram que o método foi capaz de melhorar em até 5% em relação ao método base. |
id |
UFFS_acd8737f5732b2b2a1cdb411ca78cbf7 |
---|---|
oai_identifier_str |
oai:rd.uffs.edu.br:prefix/2689 |
network_acronym_str |
UFFS |
network_name_str |
Repositório Institucional da UFFS (Repositório Digital da UFFS) |
repository_id_str |
3924 |
spelling |
Dal Bianco, GuilhermePinto, Cleiton de Lima20182019-04-04T17:55:23Z20192019-04-04T17:55:23Z2018https://rd.uffs.edu.br/handle/prefix/2689As mídias sociais estão cada vez mais presentes na vida das pessoas, incluindo ferramentas que permitem que usuário colabore com a criação do conteúdo nela exposto. Muitos usuários se aproveitam dessa funcionalidade para disseminar conteúdo ilícito ou criminoso. Caso não seja removido, este conteúdo será visto por cada vez mais pessoas e poderá ser propagado pela internet, atingindo um número maior de vítimas e incentivando a ocorrência de outros crimes. Esse tipo de crime geralmente é voltado aos grupos mais vulneráveis da sociedade, e seus efeitos nocivos podem causar o aumento da exclusão social e da violência praticada contra esses grupos. Este trabalho propõe explorar e extrair características de textos utilizando técnicas de processamento de linguagem natural e aprendizado de máquina para detectar automaticamente discursos de ódio. Os experimentos demonstraram que o método foi capaz de melhorar em até 5% em relação ao método base.Social media is increasingly present in people’s lives, including tools that allow users to collaborate with the creation of the content exposed in it. Many users use this functionality to post texts spreading illicit or criminal content. This offensive content need be removed soon as possible otherwise more and more people we see and can propagate through the internet, reaching a more significant number of victims encouraging the occurrence of other crimes. Thisworkproposestheextractionofcharacteristicsfromtextusingnaturallanguageprocessing techniques and machine learning to detect hate speech automatically. This type of hate crime, in general, is focused on the most vulnerable groups in society, and the harmful effects can lead to increased social exclusion and violence against such groups.Submitted by SUELEN SPINDOLA BILHAR (suelen.bilhar@gmail.com) on 2019-04-04T16:42:39Z No. of bitstreams: 1 PINTO.pdf: 1976781 bytes, checksum: 18aeebaa799fb9a792993ebd78146dd6 (MD5)Approved for entry into archive by Diego dos Santos Borba (dborba@uffs.edu.br) on 2019-04-04T17:55:23Z (GMT) No. of bitstreams: 1 PINTO.pdf: 1976781 bytes, checksum: 18aeebaa799fb9a792993ebd78146dd6 (MD5)Made available in DSpace on 2019-04-04T17:55:23Z (GMT). No. of bitstreams: 1 PINTO.pdf: 1976781 bytes, checksum: 18aeebaa799fb9a792993ebd78146dd6 (MD5) Previous issue date: 2018porUniversidade Federal da Fronteira SulUFFSBrasilCampus ChapecóProcessamento de linguagem naturalAprendizado computacionalInternetExtração de características para identificação de discurso de ódio em documentosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFFS (Repositório Digital da UFFS)instname:Universidade Federal Fronteira do Sul (UFFS)instacron:UFFSLICENSElicense.txtlicense.txttext/plain; charset=utf-81866https://rd.uffs.edu.br:8443/bitstream/prefix/2689/2/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD52ORIGINALPINTO.pdfPINTO.pdfapplication/pdf1976781https://rd.uffs.edu.br:8443/bitstream/prefix/2689/1/PINTO.pdf18aeebaa799fb9a792993ebd78146dd6MD51prefix/26892019-04-04 14:55:23.307oai:rd.uffs.edu.br:prefix/2689TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório InstitucionalPUBhttps://rd.uffs.edu.br/oai/requestopendoar:39242019-04-04T17:55:23Repositório Institucional da UFFS (Repositório Digital da UFFS) - Universidade Federal Fronteira do Sul (UFFS)false |
dc.title.pt_BR.fl_str_mv |
Extração de características para identificação de discurso de ódio em documentos |
title |
Extração de características para identificação de discurso de ódio em documentos |
spellingShingle |
Extração de características para identificação de discurso de ódio em documentos Pinto, Cleiton de Lima Processamento de linguagem natural Aprendizado computacional Internet |
title_short |
Extração de características para identificação de discurso de ódio em documentos |
title_full |
Extração de características para identificação de discurso de ódio em documentos |
title_fullStr |
Extração de características para identificação de discurso de ódio em documentos |
title_full_unstemmed |
Extração de características para identificação de discurso de ódio em documentos |
title_sort |
Extração de características para identificação de discurso de ódio em documentos |
author |
Pinto, Cleiton de Lima |
author_facet |
Pinto, Cleiton de Lima |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Dal Bianco, Guilherme |
dc.contributor.author.fl_str_mv |
Pinto, Cleiton de Lima |
contributor_str_mv |
Dal Bianco, Guilherme |
dc.subject.por.fl_str_mv |
Processamento de linguagem natural Aprendizado computacional Internet |
topic |
Processamento de linguagem natural Aprendizado computacional Internet |
description |
As mídias sociais estão cada vez mais presentes na vida das pessoas, incluindo ferramentas que permitem que usuário colabore com a criação do conteúdo nela exposto. Muitos usuários se aproveitam dessa funcionalidade para disseminar conteúdo ilícito ou criminoso. Caso não seja removido, este conteúdo será visto por cada vez mais pessoas e poderá ser propagado pela internet, atingindo um número maior de vítimas e incentivando a ocorrência de outros crimes. Esse tipo de crime geralmente é voltado aos grupos mais vulneráveis da sociedade, e seus efeitos nocivos podem causar o aumento da exclusão social e da violência praticada contra esses grupos. Este trabalho propõe explorar e extrair características de textos utilizando técnicas de processamento de linguagem natural e aprendizado de máquina para detectar automaticamente discursos de ódio. Os experimentos demonstraram que o método foi capaz de melhorar em até 5% em relação ao método base. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018 |
dc.date.issued.fl_str_mv |
2018 |
dc.date.accessioned.fl_str_mv |
2019-04-04T17:55:23Z |
dc.date.available.fl_str_mv |
2019 2019-04-04T17:55:23Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://rd.uffs.edu.br/handle/prefix/2689 |
url |
https://rd.uffs.edu.br/handle/prefix/2689 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal da Fronteira Sul |
dc.publisher.initials.fl_str_mv |
UFFS |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Campus Chapecó |
publisher.none.fl_str_mv |
Universidade Federal da Fronteira Sul |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFFS (Repositório Digital da UFFS) instname:Universidade Federal Fronteira do Sul (UFFS) instacron:UFFS |
instname_str |
Universidade Federal Fronteira do Sul (UFFS) |
instacron_str |
UFFS |
institution |
UFFS |
reponame_str |
Repositório Institucional da UFFS (Repositório Digital da UFFS) |
collection |
Repositório Institucional da UFFS (Repositório Digital da UFFS) |
bitstream.url.fl_str_mv |
https://rd.uffs.edu.br:8443/bitstream/prefix/2689/2/license.txt https://rd.uffs.edu.br:8443/bitstream/prefix/2689/1/PINTO.pdf |
bitstream.checksum.fl_str_mv |
43cd690d6a359e86c1fe3d5b7cba0c9b 18aeebaa799fb9a792993ebd78146dd6 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFFS (Repositório Digital da UFFS) - Universidade Federal Fronteira do Sul (UFFS) |
repository.mail.fl_str_mv |
|
_version_ |
1809094609510334464 |