Análise estatística de textos

Lopes, Evandro Dalbem

Análise estatística de textos

Detalhes bibliográficos
Autor(a) principal:	Lopes, Evandro Dalbem
Data de Publicação:	2013
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo:	https://app.uff.br/riuff/handle/1/14755
Resumo:	Desde a popularização da internet existiu um crescimento acelerado de serviços disponíveis à população. Sites de notícias tornaram-se muito populares devido à velocidade de informação fornecida. Este trabalho tem como objetivo propor duas metodologias que possam ser aplicadas à análise de um conjunto de documentos, geralmente chamado de corpus. As duas metodologias propostas são a Análise Semântica Latente e a Alocação Latente de Dirichlet. A primeira tem como objetivo criar um campo semântico a fim de representar as palavras, sendo possível assim a categorização em grupos. A segunda parte do pressuposto que, ao redigir um texto, o autor possui tópicos em mente e escreve um texto alternando as diferentes palavras pertencente a cada um destes tópicos, sendo possível a modelagem do texto baseando-se em distribuições de probabilidades, na qual cada tópico é uma distribuição de probabilidade sobre as palavras do corpus

Metadados do item

id	UFF-2_2b9d32dd5fdfcd3b209df877a4601bbd
oai_identifier_str	oai:app.uff.br:1/14755
network_acronym_str	UFF-2
network_name_str	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str	2120
spelling	Análise estatística de textosProcessamento de linguagem naturalAlocação latente de DirichletAnálise semântica latenteProcessamento de linguagem natural (Computação)SemânticaMineração de dados (Computação)Desde a popularização da internet existiu um crescimento acelerado de serviços disponíveis à população. Sites de notícias tornaram-se muito populares devido à velocidade de informação fornecida. Este trabalho tem como objetivo propor duas metodologias que possam ser aplicadas à análise de um conjunto de documentos, geralmente chamado de corpus. As duas metodologias propostas são a Análise Semântica Latente e a Alocação Latente de Dirichlet. A primeira tem como objetivo criar um campo semântico a fim de representar as palavras, sendo possível assim a categorização em grupos. A segunda parte do pressuposto que, ao redigir um texto, o autor possui tópicos em mente e escreve um texto alternando as diferentes palavras pertencente a cada um destes tópicos, sendo possível a modelagem do texto baseando-se em distribuições de probabilidades, na qual cada tópico é uma distribuição de probabilidade sobre as palavras do corpusKubrusly, Jessica QuintanilhaBastos, Leonardo SoaresSouza, Mariana Albi de OliveiraRosa, Joel Maurício Corrêa daLopes, Evandro Dalbem2020-08-26T14:48:26Z2020-08-26T14:48:26Z2013info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfLOPES, Evandro Dalbem. Análise estatística de textos. 2012. 45 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2012.https://app.uff.br/riuff/handle/1/14755http://creativecommons.org/licenses/by-nc-nd/3.0/br/CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2021-09-28T20:56:18Zoai:app.uff.br:1/14755Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202021-09-28T20:56:18Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv	Análise estatística de textos
title	Análise estatística de textos
spellingShingle	Análise estatística de textos Lopes, Evandro Dalbem Processamento de linguagem natural Alocação latente de Dirichlet Análise semântica latente Processamento de linguagem natural (Computação) Semântica Mineração de dados (Computação)
title_short	Análise estatística de textos
title_full	Análise estatística de textos
title_fullStr	Análise estatística de textos
title_full_unstemmed	Análise estatística de textos
title_sort	Análise estatística de textos
author	Lopes, Evandro Dalbem
author_facet	Lopes, Evandro Dalbem
author_role	author
dc.contributor.none.fl_str_mv	Kubrusly, Jessica Quintanilha Bastos, Leonardo Soares Souza, Mariana Albi de Oliveira Rosa, Joel Maurício Corrêa da
dc.contributor.author.fl_str_mv	Lopes, Evandro Dalbem
dc.subject.por.fl_str_mv	Processamento de linguagem natural Alocação latente de Dirichlet Análise semântica latente Processamento de linguagem natural (Computação) Semântica Mineração de dados (Computação)
topic	Processamento de linguagem natural Alocação latente de Dirichlet Análise semântica latente Processamento de linguagem natural (Computação) Semântica Mineração de dados (Computação)
description	Desde a popularização da internet existiu um crescimento acelerado de serviços disponíveis à população. Sites de notícias tornaram-se muito populares devido à velocidade de informação fornecida. Este trabalho tem como objetivo propor duas metodologias que possam ser aplicadas à análise de um conjunto de documentos, geralmente chamado de corpus. As duas metodologias propostas são a Análise Semântica Latente e a Alocação Latente de Dirichlet. A primeira tem como objetivo criar um campo semântico a fim de representar as palavras, sendo possível assim a categorização em grupos. A segunda parte do pressuposto que, ao redigir um texto, o autor possui tópicos em mente e escreve um texto alternando as diferentes palavras pertencente a cada um destes tópicos, sendo possível a modelagem do texto baseando-se em distribuições de probabilidades, na qual cada tópico é uma distribuição de probabilidade sobre as palavras do corpus
publishDate	2013
dc.date.none.fl_str_mv	2013 2020-08-26T14:48:26Z 2020-08-26T14:48:26Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	LOPES, Evandro Dalbem. Análise estatística de textos. 2012. 45 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2012. https://app.uff.br/riuff/handle/1/14755
identifier_str_mv	LOPES, Evandro Dalbem. Análise estatística de textos. 2012. 45 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2012.
url	https://app.uff.br/riuff/handle/1/14755
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	http://creativecommons.org/licenses/by-nc-nd/3.0/br/ CC-BY-SA info:eu-repo/semantics/openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc-nd/3.0/br/ CC-BY-SA
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF
instname_str	Universidade Federal Fluminense (UFF)
instacron_str	UFF
institution	UFF
reponame_str	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv	Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv	riuff@id.uff.br
_version_	1819053671327989760

Análise estatística de textos

Registros relacionados