Atribuição autoral de textos digitais

Detalhes bibliográficos
Autor(a) principal: Custódio, José Eleandro
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/100/100131/tde-06022020-120251/
Resumo: A atribuição autoral de textos digitais (AA) visa identificar quem é o autor de um determinado texto a partir de um conjunto de autores possíveis. Sua aplicação pode ajudar na solução de casos de escândalos de corrupção, na identificação de abusos na utilização da internet, na detecção de notícias falsas, na detecção de pseudônimos e outros. Esse trabalho apresenta um estudo que usou n-gramas de caracteres, de palavras, de anotações linguísticas (POS), modelos de representação distribuída (embeddings). Foram aplicados métodos de aprendizado de máquina e proposto um método para combinar diversos modelos. Os resultados foram avaliados nos domínios literatura, letras de músicas e mensagens de microblogs
id USP_9dd9cb68d64ab5276b7647730af96122
oai_identifier_str oai:teses.usp.br:tde-06022020-120251
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Atribuição autoral de textos digitaisAuthorship Attribution of digital textsPart-of-speech. POSWord embeddingAprendizado de máquinaAtribuição autoralAuthor identificationAuthorship attribuitionDistorções textuaisEmbeddingIdentificação autoralMachine learningNatural language processingNLPPart-of-speech. POSPLNProcessamento de língua naturalText distortionA atribuição autoral de textos digitais (AA) visa identificar quem é o autor de um determinado texto a partir de um conjunto de autores possíveis. Sua aplicação pode ajudar na solução de casos de escândalos de corrupção, na identificação de abusos na utilização da internet, na detecção de notícias falsas, na detecção de pseudônimos e outros. Esse trabalho apresenta um estudo que usou n-gramas de caracteres, de palavras, de anotações linguísticas (POS), modelos de representação distribuída (embeddings). Foram aplicados métodos de aprendizado de máquina e proposto um método para combinar diversos modelos. Os resultados foram avaliados nos domínios literatura, letras de músicas e mensagens de microblogsAuthorship attribution (AA) of digital text is a computational task which aims to identify who is the author of a text given a set of candidate authors. Its application may help to solve corruption scandals, identification of abuses on internet usage, fake news detection or pseudonyms detection. Computational methods for AA includes multivariate statistics and machine learning. This work presents a study that used n-grams of characters, words, linguistic annotations (POS) and word embeddings models. Machine learning methods were applied and it was proposed a method to combine several models. Results were evaluated in literature, song lyrics and microblogging domainsBiblioteca Digitais de Teses e Dissertações da USPParaboni, IvandreCustódio, José Eleandro2019-12-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100131/tde-06022020-120251/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-03-24T17:16:02Zoai:teses.usp.br:tde-06022020-120251Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-03-24T17:16:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Atribuição autoral de textos digitais
Authorship Attribution of digital texts
title Atribuição autoral de textos digitais
spellingShingle Atribuição autoral de textos digitais
Custódio, José Eleandro
Part-of-speech. POS
Word embedding
Aprendizado de máquina
Atribuição autoral
Author identification
Authorship attribuition
Distorções textuais
Embedding
Identificação autoral
Machine learning
Natural language processing
NLP
Part-of-speech. POS
PLN
Processamento de língua natural
Text distortion
title_short Atribuição autoral de textos digitais
title_full Atribuição autoral de textos digitais
title_fullStr Atribuição autoral de textos digitais
title_full_unstemmed Atribuição autoral de textos digitais
title_sort Atribuição autoral de textos digitais
author Custódio, José Eleandro
author_facet Custódio, José Eleandro
author_role author
dc.contributor.none.fl_str_mv Paraboni, Ivandre
dc.contributor.author.fl_str_mv Custódio, José Eleandro
dc.subject.por.fl_str_mv Part-of-speech. POS
Word embedding
Aprendizado de máquina
Atribuição autoral
Author identification
Authorship attribuition
Distorções textuais
Embedding
Identificação autoral
Machine learning
Natural language processing
NLP
Part-of-speech. POS
PLN
Processamento de língua natural
Text distortion
topic Part-of-speech. POS
Word embedding
Aprendizado de máquina
Atribuição autoral
Author identification
Authorship attribuition
Distorções textuais
Embedding
Identificação autoral
Machine learning
Natural language processing
NLP
Part-of-speech. POS
PLN
Processamento de língua natural
Text distortion
description A atribuição autoral de textos digitais (AA) visa identificar quem é o autor de um determinado texto a partir de um conjunto de autores possíveis. Sua aplicação pode ajudar na solução de casos de escândalos de corrupção, na identificação de abusos na utilização da internet, na detecção de notícias falsas, na detecção de pseudônimos e outros. Esse trabalho apresenta um estudo que usou n-gramas de caracteres, de palavras, de anotações linguísticas (POS), modelos de representação distribuída (embeddings). Foram aplicados métodos de aprendizado de máquina e proposto um método para combinar diversos modelos. Os resultados foram avaliados nos domínios literatura, letras de músicas e mensagens de microblogs
publishDate 2019
dc.date.none.fl_str_mv 2019-12-09
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/100/100131/tde-06022020-120251/
url https://www.teses.usp.br/teses/disponiveis/100/100131/tde-06022020-120251/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090435560243200