Análise estatística de textos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | https://app.uff.br/riuff/handle/1/14755 |
Resumo: | Desde a popularização da internet existiu um crescimento acelerado de serviços disponíveis à população. Sites de notícias tornaram-se muito populares devido à velocidade de informação fornecida. Este trabalho tem como objetivo propor duas metodologias que possam ser aplicadas à análise de um conjunto de documentos, geralmente chamado de corpus. As duas metodologias propostas são a Análise Semântica Latente e a Alocação Latente de Dirichlet. A primeira tem como objetivo criar um campo semântico a fim de representar as palavras, sendo possível assim a categorização em grupos. A segunda parte do pressuposto que, ao redigir um texto, o autor possui tópicos em mente e escreve um texto alternando as diferentes palavras pertencente a cada um destes tópicos, sendo possível a modelagem do texto baseando-se em distribuições de probabilidades, na qual cada tópico é uma distribuição de probabilidade sobre as palavras do corpus |
id |
UFF-2_2b9d32dd5fdfcd3b209df877a4601bbd |
---|---|
oai_identifier_str |
oai:app.uff.br:1/14755 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Análise estatística de textosProcessamento de linguagem naturalAlocação latente de DirichletAnálise semântica latenteProcessamento de linguagem natural (Computação)SemânticaMineração de dados (Computação)Desde a popularização da internet existiu um crescimento acelerado de serviços disponíveis à população. Sites de notícias tornaram-se muito populares devido à velocidade de informação fornecida. Este trabalho tem como objetivo propor duas metodologias que possam ser aplicadas à análise de um conjunto de documentos, geralmente chamado de corpus. As duas metodologias propostas são a Análise Semântica Latente e a Alocação Latente de Dirichlet. A primeira tem como objetivo criar um campo semântico a fim de representar as palavras, sendo possível assim a categorização em grupos. A segunda parte do pressuposto que, ao redigir um texto, o autor possui tópicos em mente e escreve um texto alternando as diferentes palavras pertencente a cada um destes tópicos, sendo possível a modelagem do texto baseando-se em distribuições de probabilidades, na qual cada tópico é uma distribuição de probabilidade sobre as palavras do corpusKubrusly, Jessica QuintanilhaBastos, Leonardo SoaresSouza, Mariana Albi de OliveiraRosa, Joel Maurício Corrêa daLopes, Evandro Dalbem2020-08-26T14:48:26Z2020-08-26T14:48:26Z2013info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfLOPES, Evandro Dalbem. Análise estatística de textos. 2012. 45 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2012.https://app.uff.br/riuff/handle/1/14755http://creativecommons.org/licenses/by-nc-nd/3.0/br/CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2021-09-28T20:56:18Zoai:app.uff.br:1/14755Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202021-09-28T20:56:18Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Análise estatística de textos |
title |
Análise estatística de textos |
spellingShingle |
Análise estatística de textos Lopes, Evandro Dalbem Processamento de linguagem natural Alocação latente de Dirichlet Análise semântica latente Processamento de linguagem natural (Computação) Semântica Mineração de dados (Computação) |
title_short |
Análise estatística de textos |
title_full |
Análise estatística de textos |
title_fullStr |
Análise estatística de textos |
title_full_unstemmed |
Análise estatística de textos |
title_sort |
Análise estatística de textos |
author |
Lopes, Evandro Dalbem |
author_facet |
Lopes, Evandro Dalbem |
author_role |
author |
dc.contributor.none.fl_str_mv |
Kubrusly, Jessica Quintanilha Bastos, Leonardo Soares Souza, Mariana Albi de Oliveira Rosa, Joel Maurício Corrêa da |
dc.contributor.author.fl_str_mv |
Lopes, Evandro Dalbem |
dc.subject.por.fl_str_mv |
Processamento de linguagem natural Alocação latente de Dirichlet Análise semântica latente Processamento de linguagem natural (Computação) Semântica Mineração de dados (Computação) |
topic |
Processamento de linguagem natural Alocação latente de Dirichlet Análise semântica latente Processamento de linguagem natural (Computação) Semântica Mineração de dados (Computação) |
description |
Desde a popularização da internet existiu um crescimento acelerado de serviços disponíveis à população. Sites de notícias tornaram-se muito populares devido à velocidade de informação fornecida. Este trabalho tem como objetivo propor duas metodologias que possam ser aplicadas à análise de um conjunto de documentos, geralmente chamado de corpus. As duas metodologias propostas são a Análise Semântica Latente e a Alocação Latente de Dirichlet. A primeira tem como objetivo criar um campo semântico a fim de representar as palavras, sendo possível assim a categorização em grupos. A segunda parte do pressuposto que, ao redigir um texto, o autor possui tópicos em mente e escreve um texto alternando as diferentes palavras pertencente a cada um destes tópicos, sendo possível a modelagem do texto baseando-se em distribuições de probabilidades, na qual cada tópico é uma distribuição de probabilidade sobre as palavras do corpus |
publishDate |
2013 |
dc.date.none.fl_str_mv |
2013 2020-08-26T14:48:26Z 2020-08-26T14:48:26Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
LOPES, Evandro Dalbem. Análise estatística de textos. 2012. 45 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2012. https://app.uff.br/riuff/handle/1/14755 |
identifier_str_mv |
LOPES, Evandro Dalbem. Análise estatística de textos. 2012. 45 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2012. |
url |
https://app.uff.br/riuff/handle/1/14755 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1819053671327989760 |