Extração de características para identificação de discurso de ódio em documentos

Pinto, Cleiton de Lima

Extração de características para identificação de discurso de ódio em documentos

Detalhes bibliográficos
Autor(a) principal:	Pinto, Cleiton de Lima
Data de Publicação:	2018
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UFFS (Repositório Digital da UFFS)
Texto Completo:	https://rd.uffs.edu.br/handle/prefix/2689
Resumo:	As mídias sociais estão cada vez mais presentes na vida das pessoas, incluindo ferramentas que permitem que usuário colabore com a criação do conteúdo nela exposto. Muitos usuários se aproveitam dessa funcionalidade para disseminar conteúdo ilícito ou criminoso. Caso não seja removido, este conteúdo será visto por cada vez mais pessoas e poderá ser propagado pela internet, atingindo um número maior de vítimas e incentivando a ocorrência de outros crimes. Esse tipo de crime geralmente é voltado aos grupos mais vulneráveis da sociedade, e seus efeitos nocivos podem causar o aumento da exclusão social e da violência praticada contra esses grupos. Este trabalho propõe explorar e extrair características de textos utilizando técnicas de processamento de linguagem natural e aprendizado de máquina para detectar automaticamente discursos de ódio. Os experimentos demonstraram que o método foi capaz de melhorar em até 5% em relação ao método base.

Metadados do item

id	UFFS_acd8737f5732b2b2a1cdb411ca78cbf7
oai_identifier_str	oai:rd.uffs.edu.br:prefix/2689
network_acronym_str	UFFS
network_name_str	Repositório Institucional da UFFS (Repositório Digital da UFFS)
repository_id_str	3924
spelling	Dal Bianco, GuilhermePinto, Cleiton de Lima20182019-04-04T17:55:23Z20192019-04-04T17:55:23Z2018https://rd.uffs.edu.br/handle/prefix/2689As mídias sociais estão cada vez mais presentes na vida das pessoas, incluindo ferramentas que permitem que usuário colabore com a criação do conteúdo nela exposto. Muitos usuários se aproveitam dessa funcionalidade para disseminar conteúdo ilícito ou criminoso. Caso não seja removido, este conteúdo será visto por cada vez mais pessoas e poderá ser propagado pela internet, atingindo um número maior de vítimas e incentivando a ocorrência de outros crimes. Esse tipo de crime geralmente é voltado aos grupos mais vulneráveis da sociedade, e seus efeitos nocivos podem causar o aumento da exclusão social e da violência praticada contra esses grupos. Este trabalho propõe explorar e extrair características de textos utilizando técnicas de processamento de linguagem natural e aprendizado de máquina para detectar automaticamente discursos de ódio. Os experimentos demonstraram que o método foi capaz de melhorar em até 5% em relação ao método base.Social media is increasingly present in people’s lives, including tools that allow users to collaborate with the creation of the content exposed in it. Many users use this functionality to post texts spreading illicit or criminal content. This offensive content need be removed soon as possible otherwise more and more people we see and can propagate through the internet, reaching a more signiﬁcant number of victims encouraging the occurrence of other crimes. Thisworkproposestheextractionofcharacteristicsfromtextusingnaturallanguageprocessing techniques and machine learning to detect hate speech automatically. This type of hate crime, in general, is focused on the most vulnerable groups in society, and the harmful effects can lead to increased social exclusion and violence against such groups.Submitted by SUELEN SPINDOLA BILHAR (suelen.bilhar@gmail.com) on 2019-04-04T16:42:39Z No. of bitstreams: 1 PINTO.pdf: 1976781 bytes, checksum: 18aeebaa799fb9a792993ebd78146dd6 (MD5)Approved for entry into archive by Diego dos Santos Borba (dborba@uffs.edu.br) on 2019-04-04T17:55:23Z (GMT) No. of bitstreams: 1 PINTO.pdf: 1976781 bytes, checksum: 18aeebaa799fb9a792993ebd78146dd6 (MD5)Made available in DSpace on 2019-04-04T17:55:23Z (GMT). No. of bitstreams: 1 PINTO.pdf: 1976781 bytes, checksum: 18aeebaa799fb9a792993ebd78146dd6 (MD5) Previous issue date: 2018porUniversidade Federal da Fronteira SulUFFSBrasilCampus ChapecóProcessamento de linguagem naturalAprendizado computacionalInternetExtração de características para identificação de discurso de ódio em documentosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFFS (Repositório Digital da UFFS)instname:Universidade Federal Fronteira do Sul (UFFS)instacron:UFFSLICENSElicense.txtlicense.txttext/plain; charset=utf-81866https://rd.uffs.edu.br:8443/bitstream/prefix/2689/2/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD52ORIGINALPINTO.pdfPINTO.pdfapplication/pdf1976781https://rd.uffs.edu.br:8443/bitstream/prefix/2689/1/PINTO.pdf18aeebaa799fb9a792993ebd78146dd6MD51prefix/26892019-04-04 14:55:23.307oai:rd.uffs.edu.br:prefix/2689TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório InstitucionalPUBhttps://rd.uffs.edu.br/oai/requestopendoar:39242019-04-04T17:55:23Repositório Institucional da UFFS (Repositório Digital da UFFS) - Universidade Federal Fronteira do Sul (UFFS)false
dc.title.pt_BR.fl_str_mv	Extração de características para identificação de discurso de ódio em documentos
title	Extração de características para identificação de discurso de ódio em documentos
spellingShingle	Extração de características para identificação de discurso de ódio em documentos Pinto, Cleiton de Lima Processamento de linguagem natural Aprendizado computacional Internet
title_short	Extração de características para identificação de discurso de ódio em documentos
title_full	Extração de características para identificação de discurso de ódio em documentos
title_fullStr	Extração de características para identificação de discurso de ódio em documentos
title_full_unstemmed	Extração de características para identificação de discurso de ódio em documentos
title_sort	Extração de características para identificação de discurso de ódio em documentos
author	Pinto, Cleiton de Lima
author_facet	Pinto, Cleiton de Lima
author_role	author
dc.contributor.advisor1.fl_str_mv	Dal Bianco, Guilherme
dc.contributor.author.fl_str_mv	Pinto, Cleiton de Lima
contributor_str_mv	Dal Bianco, Guilherme
dc.subject.por.fl_str_mv	Processamento de linguagem natural Aprendizado computacional Internet
topic	Processamento de linguagem natural Aprendizado computacional Internet
description	As mídias sociais estão cada vez mais presentes na vida das pessoas, incluindo ferramentas que permitem que usuário colabore com a criação do conteúdo nela exposto. Muitos usuários se aproveitam dessa funcionalidade para disseminar conteúdo ilícito ou criminoso. Caso não seja removido, este conteúdo será visto por cada vez mais pessoas e poderá ser propagado pela internet, atingindo um número maior de vítimas e incentivando a ocorrência de outros crimes. Esse tipo de crime geralmente é voltado aos grupos mais vulneráveis da sociedade, e seus efeitos nocivos podem causar o aumento da exclusão social e da violência praticada contra esses grupos. Este trabalho propõe explorar e extrair características de textos utilizando técnicas de processamento de linguagem natural e aprendizado de máquina para detectar automaticamente discursos de ódio. Os experimentos demonstraram que o método foi capaz de melhorar em até 5% em relação ao método base.
publishDate	2018
dc.date.none.fl_str_mv	2018
dc.date.issued.fl_str_mv	2018
dc.date.accessioned.fl_str_mv	2019-04-04T17:55:23Z
dc.date.available.fl_str_mv	2019 2019-04-04T17:55:23Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://rd.uffs.edu.br/handle/prefix/2689
url	https://rd.uffs.edu.br/handle/prefix/2689
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal da Fronteira Sul
dc.publisher.initials.fl_str_mv	UFFS
dc.publisher.country.fl_str_mv	Brasil
dc.publisher.department.fl_str_mv	Campus Chapecó
publisher.none.fl_str_mv	Universidade Federal da Fronteira Sul
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFFS (Repositório Digital da UFFS) instname:Universidade Federal Fronteira do Sul (UFFS) instacron:UFFS
instname_str	Universidade Federal Fronteira do Sul (UFFS)
instacron_str	UFFS
institution	UFFS
reponame_str	Repositório Institucional da UFFS (Repositório Digital da UFFS)
collection	Repositório Institucional da UFFS (Repositório Digital da UFFS)
bitstream.url.fl_str_mv	https://rd.uffs.edu.br:8443/bitstream/prefix/2689/2/license.txt https://rd.uffs.edu.br:8443/bitstream/prefix/2689/1/PINTO.pdf
bitstream.checksum.fl_str_mv	43cd690d6a359e86c1fe3d5b7cba0c9b 18aeebaa799fb9a792993ebd78146dd6
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFFS (Repositório Digital da UFFS) - Universidade Federal Fronteira do Sul (UFFS)
repository.mail.fl_str_mv
_version_	1809094609510334464

Extração de características para identificação de discurso de ódio em documentos

Registros relacionados