Análise estatística de textos

Detalhes bibliográficos
Autor(a) principal: Lopes, Evandro Dalbem
Data de Publicação: 2013
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: https://app.uff.br/riuff/handle/1/14755
Resumo: Desde a popularização da internet existiu um crescimento acelerado de serviços disponíveis à população. Sites de notícias tornaram-se muito populares devido à velocidade de informação fornecida. Este trabalho tem como objetivo propor duas metodologias que possam ser aplicadas à análise de um conjunto de documentos, geralmente chamado de corpus. As duas metodologias propostas são a Análise Semântica Latente e a Alocação Latente de Dirichlet. A primeira tem como objetivo criar um campo semântico a fim de representar as palavras, sendo possível assim a categorização em grupos. A segunda parte do pressuposto que, ao redigir um texto, o autor possui tópicos em mente e escreve um texto alternando as diferentes palavras pertencente a cada um destes tópicos, sendo possível a modelagem do texto baseando-se em distribuições de probabilidades, na qual cada tópico é uma distribuição de probabilidade sobre as palavras do corpus
id UFF-2_2b9d32dd5fdfcd3b209df877a4601bbd
oai_identifier_str oai:app.uff.br:1/14755
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Análise estatística de textosProcessamento de linguagem naturalAlocação latente de DirichletAnálise semântica latenteProcessamento de linguagem natural (Computação)SemânticaMineração de dados (Computação)Desde a popularização da internet existiu um crescimento acelerado de serviços disponíveis à população. Sites de notícias tornaram-se muito populares devido à velocidade de informação fornecida. Este trabalho tem como objetivo propor duas metodologias que possam ser aplicadas à análise de um conjunto de documentos, geralmente chamado de corpus. As duas metodologias propostas são a Análise Semântica Latente e a Alocação Latente de Dirichlet. A primeira tem como objetivo criar um campo semântico a fim de representar as palavras, sendo possível assim a categorização em grupos. A segunda parte do pressuposto que, ao redigir um texto, o autor possui tópicos em mente e escreve um texto alternando as diferentes palavras pertencente a cada um destes tópicos, sendo possível a modelagem do texto baseando-se em distribuições de probabilidades, na qual cada tópico é uma distribuição de probabilidade sobre as palavras do corpusKubrusly, Jessica QuintanilhaBastos, Leonardo SoaresSouza, Mariana Albi de OliveiraRosa, Joel Maurício Corrêa daLopes, Evandro Dalbem2020-08-26T14:48:26Z2020-08-26T14:48:26Z2013info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfLOPES, Evandro Dalbem. Análise estatística de textos. 2012. 45 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2012.https://app.uff.br/riuff/handle/1/14755http://creativecommons.org/licenses/by-nc-nd/3.0/br/CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2021-09-28T20:56:18Zoai:app.uff.br:1/14755Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202021-09-28T20:56:18Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Análise estatística de textos
title Análise estatística de textos
spellingShingle Análise estatística de textos
Lopes, Evandro Dalbem
Processamento de linguagem natural
Alocação latente de Dirichlet
Análise semântica latente
Processamento de linguagem natural (Computação)
Semântica
Mineração de dados (Computação)
title_short Análise estatística de textos
title_full Análise estatística de textos
title_fullStr Análise estatística de textos
title_full_unstemmed Análise estatística de textos
title_sort Análise estatística de textos
author Lopes, Evandro Dalbem
author_facet Lopes, Evandro Dalbem
author_role author
dc.contributor.none.fl_str_mv Kubrusly, Jessica Quintanilha
Bastos, Leonardo Soares
Souza, Mariana Albi de Oliveira
Rosa, Joel Maurício Corrêa da
dc.contributor.author.fl_str_mv Lopes, Evandro Dalbem
dc.subject.por.fl_str_mv Processamento de linguagem natural
Alocação latente de Dirichlet
Análise semântica latente
Processamento de linguagem natural (Computação)
Semântica
Mineração de dados (Computação)
topic Processamento de linguagem natural
Alocação latente de Dirichlet
Análise semântica latente
Processamento de linguagem natural (Computação)
Semântica
Mineração de dados (Computação)
description Desde a popularização da internet existiu um crescimento acelerado de serviços disponíveis à população. Sites de notícias tornaram-se muito populares devido à velocidade de informação fornecida. Este trabalho tem como objetivo propor duas metodologias que possam ser aplicadas à análise de um conjunto de documentos, geralmente chamado de corpus. As duas metodologias propostas são a Análise Semântica Latente e a Alocação Latente de Dirichlet. A primeira tem como objetivo criar um campo semântico a fim de representar as palavras, sendo possível assim a categorização em grupos. A segunda parte do pressuposto que, ao redigir um texto, o autor possui tópicos em mente e escreve um texto alternando as diferentes palavras pertencente a cada um destes tópicos, sendo possível a modelagem do texto baseando-se em distribuições de probabilidades, na qual cada tópico é uma distribuição de probabilidade sobre as palavras do corpus
publishDate 2013
dc.date.none.fl_str_mv 2013
2020-08-26T14:48:26Z
2020-08-26T14:48:26Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv LOPES, Evandro Dalbem. Análise estatística de textos. 2012. 45 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2012.
https://app.uff.br/riuff/handle/1/14755
identifier_str_mv LOPES, Evandro Dalbem. Análise estatística de textos. 2012. 45 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2012.
url https://app.uff.br/riuff/handle/1/14755
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1819053671327989760