Atribuição autoral de textos digitais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/100/100131/tde-06022020-120251/ |
Resumo: | A atribuição autoral de textos digitais (AA) visa identificar quem é o autor de um determinado texto a partir de um conjunto de autores possíveis. Sua aplicação pode ajudar na solução de casos de escândalos de corrupção, na identificação de abusos na utilização da internet, na detecção de notícias falsas, na detecção de pseudônimos e outros. Esse trabalho apresenta um estudo que usou n-gramas de caracteres, de palavras, de anotações linguísticas (POS), modelos de representação distribuída (embeddings). Foram aplicados métodos de aprendizado de máquina e proposto um método para combinar diversos modelos. Os resultados foram avaliados nos domínios literatura, letras de músicas e mensagens de microblogs |
id |
USP_9dd9cb68d64ab5276b7647730af96122 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-06022020-120251 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Atribuição autoral de textos digitaisAuthorship Attribution of digital textsPart-of-speech. POSWord embeddingAprendizado de máquinaAtribuição autoralAuthor identificationAuthorship attribuitionDistorções textuaisEmbeddingIdentificação autoralMachine learningNatural language processingNLPPart-of-speech. POSPLNProcessamento de língua naturalText distortionA atribuição autoral de textos digitais (AA) visa identificar quem é o autor de um determinado texto a partir de um conjunto de autores possíveis. Sua aplicação pode ajudar na solução de casos de escândalos de corrupção, na identificação de abusos na utilização da internet, na detecção de notícias falsas, na detecção de pseudônimos e outros. Esse trabalho apresenta um estudo que usou n-gramas de caracteres, de palavras, de anotações linguísticas (POS), modelos de representação distribuída (embeddings). Foram aplicados métodos de aprendizado de máquina e proposto um método para combinar diversos modelos. Os resultados foram avaliados nos domínios literatura, letras de músicas e mensagens de microblogsAuthorship attribution (AA) of digital text is a computational task which aims to identify who is the author of a text given a set of candidate authors. Its application may help to solve corruption scandals, identification of abuses on internet usage, fake news detection or pseudonyms detection. Computational methods for AA includes multivariate statistics and machine learning. This work presents a study that used n-grams of characters, words, linguistic annotations (POS) and word embeddings models. Machine learning methods were applied and it was proposed a method to combine several models. Results were evaluated in literature, song lyrics and microblogging domainsBiblioteca Digitais de Teses e Dissertações da USPParaboni, IvandreCustódio, José Eleandro2019-12-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100131/tde-06022020-120251/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-03-24T17:16:02Zoai:teses.usp.br:tde-06022020-120251Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-03-24T17:16:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Atribuição autoral de textos digitais Authorship Attribution of digital texts |
title |
Atribuição autoral de textos digitais |
spellingShingle |
Atribuição autoral de textos digitais Custódio, José Eleandro Part-of-speech. POS Word embedding Aprendizado de máquina Atribuição autoral Author identification Authorship attribuition Distorções textuais Embedding Identificação autoral Machine learning Natural language processing NLP Part-of-speech. POS PLN Processamento de língua natural Text distortion |
title_short |
Atribuição autoral de textos digitais |
title_full |
Atribuição autoral de textos digitais |
title_fullStr |
Atribuição autoral de textos digitais |
title_full_unstemmed |
Atribuição autoral de textos digitais |
title_sort |
Atribuição autoral de textos digitais |
author |
Custódio, José Eleandro |
author_facet |
Custódio, José Eleandro |
author_role |
author |
dc.contributor.none.fl_str_mv |
Paraboni, Ivandre |
dc.contributor.author.fl_str_mv |
Custódio, José Eleandro |
dc.subject.por.fl_str_mv |
Part-of-speech. POS Word embedding Aprendizado de máquina Atribuição autoral Author identification Authorship attribuition Distorções textuais Embedding Identificação autoral Machine learning Natural language processing NLP Part-of-speech. POS PLN Processamento de língua natural Text distortion |
topic |
Part-of-speech. POS Word embedding Aprendizado de máquina Atribuição autoral Author identification Authorship attribuition Distorções textuais Embedding Identificação autoral Machine learning Natural language processing NLP Part-of-speech. POS PLN Processamento de língua natural Text distortion |
description |
A atribuição autoral de textos digitais (AA) visa identificar quem é o autor de um determinado texto a partir de um conjunto de autores possíveis. Sua aplicação pode ajudar na solução de casos de escândalos de corrupção, na identificação de abusos na utilização da internet, na detecção de notícias falsas, na detecção de pseudônimos e outros. Esse trabalho apresenta um estudo que usou n-gramas de caracteres, de palavras, de anotações linguísticas (POS), modelos de representação distribuída (embeddings). Foram aplicados métodos de aprendizado de máquina e proposto um método para combinar diversos modelos. Os resultados foram avaliados nos domínios literatura, letras de músicas e mensagens de microblogs |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-12-09 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-06022020-120251/ |
url |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-06022020-120251/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1809090435560243200 |