Pré-processamento para extração de conhecimento de bases textuais

Detalhes bibliográficos
Autor(a) principal: Imamura, Cristiane Yae- Mi
Data de Publicação: 2001
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012018-144536/
Resumo: A descoberta de conhecimento em bases de dados é uma área de pesquisa que tem crescido rapidamente, e cujo desenvolvimento tem. sido dirigido ao benefício das necessidades práticas. sociais e econômicas. entre outras. Entretanto. mesmo em bases de dados podem estar presentes campos importantes que não são considerados na análise, como aqueles preenchidos com informações textuais. Essas informações não estão presentes apenas em tabelas, mias também em diversos documentos que são disponibilizados e acessados através da Internet. Para tornar a descoberta de conhecimento em textos possível, tem-se associado estratégias de preparação/pré-proccssamento de textos e técnicas utilizadas no processo Data Mining. Essa associação vem sendo denominada de processo Text Mining. Tendo em vista a importância da preparação dos textos. neste trabalho foi projetado e construído um módulo de pré-processamento de textos, com a finalidade de tornar possível a realização do processo Text Mining considerando textos em português. Devido ao fato de que muitas estratégias e/ou ferramentas estarem disponíveis somente para o inglês, a possibilidade de realizar a descoberta de padrões em textos em português pode significar o alcance de novos horizontes era termos de oportunidades e informações desconhecidas.
id USP_01f9cc00712b00f0de8588ff130af782
oai_identifier_str oai:teses.usp.br:tde-19012018-144536
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Pré-processamento para extração de conhecimento de bases textuaisNot availableNão disponívelNot availableA descoberta de conhecimento em bases de dados é uma área de pesquisa que tem crescido rapidamente, e cujo desenvolvimento tem. sido dirigido ao benefício das necessidades práticas. sociais e econômicas. entre outras. Entretanto. mesmo em bases de dados podem estar presentes campos importantes que não são considerados na análise, como aqueles preenchidos com informações textuais. Essas informações não estão presentes apenas em tabelas, mias também em diversos documentos que são disponibilizados e acessados através da Internet. Para tornar a descoberta de conhecimento em textos possível, tem-se associado estratégias de preparação/pré-proccssamento de textos e técnicas utilizadas no processo Data Mining. Essa associação vem sendo denominada de processo Text Mining. Tendo em vista a importância da preparação dos textos. neste trabalho foi projetado e construído um módulo de pré-processamento de textos, com a finalidade de tornar possível a realização do processo Text Mining considerando textos em português. Devido ao fato de que muitas estratégias e/ou ferramentas estarem disponíveis somente para o inglês, a possibilidade de realizar a descoberta de padrões em textos em português pode significar o alcance de novos horizontes era termos de oportunidades e informações desconhecidas.The knowledge discovery in data bases is a research area that have been increasing quickly, and which development has been driven to the practical, social and economical needs. However. even data bases can have important fields that are not considered in the analysis. such as those which are fulfill with textual information. This information is not present only in tables. but also in several documents that are available through the Internet. To he possible the knowledge discovery in text. text preparation/preprocossing strategies are associated with technics used in the Data Mining process. This association have been called Text Mining. Considering the importance of texts preprocessing. in this work was planned and built a module of texts pre-processing with the objective to make possible the realization of the Text Mining process for Portuguese texts. Due to the fact that many strategies and tools are available only for English, the possibility of realize the pattern discovery in Portuguese texts come to be useful to reach new goals in terms of unknown opportunities and information.Biblioteca Digitais de Teses e Dissertações da USPRezende, Solange OliveiraImamura, Cristiane Yae- Mi2001-10-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012018-144536/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2018-07-19T20:50:39Zoai:teses.usp.br:tde-19012018-144536Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212018-07-19T20:50:39Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Pré-processamento para extração de conhecimento de bases textuais
Not available
title Pré-processamento para extração de conhecimento de bases textuais
spellingShingle Pré-processamento para extração de conhecimento de bases textuais
Imamura, Cristiane Yae- Mi
Não disponível
Not available
title_short Pré-processamento para extração de conhecimento de bases textuais
title_full Pré-processamento para extração de conhecimento de bases textuais
title_fullStr Pré-processamento para extração de conhecimento de bases textuais
title_full_unstemmed Pré-processamento para extração de conhecimento de bases textuais
title_sort Pré-processamento para extração de conhecimento de bases textuais
author Imamura, Cristiane Yae- Mi
author_facet Imamura, Cristiane Yae- Mi
author_role author
dc.contributor.none.fl_str_mv Rezende, Solange Oliveira
dc.contributor.author.fl_str_mv Imamura, Cristiane Yae- Mi
dc.subject.por.fl_str_mv Não disponível
Not available
topic Não disponível
Not available
description A descoberta de conhecimento em bases de dados é uma área de pesquisa que tem crescido rapidamente, e cujo desenvolvimento tem. sido dirigido ao benefício das necessidades práticas. sociais e econômicas. entre outras. Entretanto. mesmo em bases de dados podem estar presentes campos importantes que não são considerados na análise, como aqueles preenchidos com informações textuais. Essas informações não estão presentes apenas em tabelas, mias também em diversos documentos que são disponibilizados e acessados através da Internet. Para tornar a descoberta de conhecimento em textos possível, tem-se associado estratégias de preparação/pré-proccssamento de textos e técnicas utilizadas no processo Data Mining. Essa associação vem sendo denominada de processo Text Mining. Tendo em vista a importância da preparação dos textos. neste trabalho foi projetado e construído um módulo de pré-processamento de textos, com a finalidade de tornar possível a realização do processo Text Mining considerando textos em português. Devido ao fato de que muitas estratégias e/ou ferramentas estarem disponíveis somente para o inglês, a possibilidade de realizar a descoberta de padrões em textos em português pode significar o alcance de novos horizontes era termos de oportunidades e informações desconhecidas.
publishDate 2001
dc.date.none.fl_str_mv 2001-10-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012018-144536/
url http://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012018-144536/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257123983982592