Pré-processamento para extração de conhecimento de bases textuais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2001 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | http://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012018-144536/ |
Resumo: | A descoberta de conhecimento em bases de dados é uma área de pesquisa que tem crescido rapidamente, e cujo desenvolvimento tem. sido dirigido ao benefício das necessidades práticas. sociais e econômicas. entre outras. Entretanto. mesmo em bases de dados podem estar presentes campos importantes que não são considerados na análise, como aqueles preenchidos com informações textuais. Essas informações não estão presentes apenas em tabelas, mias também em diversos documentos que são disponibilizados e acessados através da Internet. Para tornar a descoberta de conhecimento em textos possível, tem-se associado estratégias de preparação/pré-proccssamento de textos e técnicas utilizadas no processo Data Mining. Essa associação vem sendo denominada de processo Text Mining. Tendo em vista a importância da preparação dos textos. neste trabalho foi projetado e construído um módulo de pré-processamento de textos, com a finalidade de tornar possível a realização do processo Text Mining considerando textos em português. Devido ao fato de que muitas estratégias e/ou ferramentas estarem disponíveis somente para o inglês, a possibilidade de realizar a descoberta de padrões em textos em português pode significar o alcance de novos horizontes era termos de oportunidades e informações desconhecidas. |
id |
USP_01f9cc00712b00f0de8588ff130af782 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-19012018-144536 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Pré-processamento para extração de conhecimento de bases textuaisNot availableNão disponívelNot availableA descoberta de conhecimento em bases de dados é uma área de pesquisa que tem crescido rapidamente, e cujo desenvolvimento tem. sido dirigido ao benefício das necessidades práticas. sociais e econômicas. entre outras. Entretanto. mesmo em bases de dados podem estar presentes campos importantes que não são considerados na análise, como aqueles preenchidos com informações textuais. Essas informações não estão presentes apenas em tabelas, mias também em diversos documentos que são disponibilizados e acessados através da Internet. Para tornar a descoberta de conhecimento em textos possível, tem-se associado estratégias de preparação/pré-proccssamento de textos e técnicas utilizadas no processo Data Mining. Essa associação vem sendo denominada de processo Text Mining. Tendo em vista a importância da preparação dos textos. neste trabalho foi projetado e construído um módulo de pré-processamento de textos, com a finalidade de tornar possível a realização do processo Text Mining considerando textos em português. Devido ao fato de que muitas estratégias e/ou ferramentas estarem disponíveis somente para o inglês, a possibilidade de realizar a descoberta de padrões em textos em português pode significar o alcance de novos horizontes era termos de oportunidades e informações desconhecidas.The knowledge discovery in data bases is a research area that have been increasing quickly, and which development has been driven to the practical, social and economical needs. However. even data bases can have important fields that are not considered in the analysis. such as those which are fulfill with textual information. This information is not present only in tables. but also in several documents that are available through the Internet. To he possible the knowledge discovery in text. text preparation/preprocossing strategies are associated with technics used in the Data Mining process. This association have been called Text Mining. Considering the importance of texts preprocessing. in this work was planned and built a module of texts pre-processing with the objective to make possible the realization of the Text Mining process for Portuguese texts. Due to the fact that many strategies and tools are available only for English, the possibility of realize the pattern discovery in Portuguese texts come to be useful to reach new goals in terms of unknown opportunities and information.Biblioteca Digitais de Teses e Dissertações da USPRezende, Solange OliveiraImamura, Cristiane Yae- Mi2001-10-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012018-144536/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2018-07-19T20:50:39Zoai:teses.usp.br:tde-19012018-144536Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212018-07-19T20:50:39Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Pré-processamento para extração de conhecimento de bases textuais Not available |
title |
Pré-processamento para extração de conhecimento de bases textuais |
spellingShingle |
Pré-processamento para extração de conhecimento de bases textuais Imamura, Cristiane Yae- Mi Não disponível Not available |
title_short |
Pré-processamento para extração de conhecimento de bases textuais |
title_full |
Pré-processamento para extração de conhecimento de bases textuais |
title_fullStr |
Pré-processamento para extração de conhecimento de bases textuais |
title_full_unstemmed |
Pré-processamento para extração de conhecimento de bases textuais |
title_sort |
Pré-processamento para extração de conhecimento de bases textuais |
author |
Imamura, Cristiane Yae- Mi |
author_facet |
Imamura, Cristiane Yae- Mi |
author_role |
author |
dc.contributor.none.fl_str_mv |
Rezende, Solange Oliveira |
dc.contributor.author.fl_str_mv |
Imamura, Cristiane Yae- Mi |
dc.subject.por.fl_str_mv |
Não disponível Not available |
topic |
Não disponível Not available |
description |
A descoberta de conhecimento em bases de dados é uma área de pesquisa que tem crescido rapidamente, e cujo desenvolvimento tem. sido dirigido ao benefício das necessidades práticas. sociais e econômicas. entre outras. Entretanto. mesmo em bases de dados podem estar presentes campos importantes que não são considerados na análise, como aqueles preenchidos com informações textuais. Essas informações não estão presentes apenas em tabelas, mias também em diversos documentos que são disponibilizados e acessados através da Internet. Para tornar a descoberta de conhecimento em textos possível, tem-se associado estratégias de preparação/pré-proccssamento de textos e técnicas utilizadas no processo Data Mining. Essa associação vem sendo denominada de processo Text Mining. Tendo em vista a importância da preparação dos textos. neste trabalho foi projetado e construído um módulo de pré-processamento de textos, com a finalidade de tornar possível a realização do processo Text Mining considerando textos em português. Devido ao fato de que muitas estratégias e/ou ferramentas estarem disponíveis somente para o inglês, a possibilidade de realizar a descoberta de padrões em textos em português pode significar o alcance de novos horizontes era termos de oportunidades e informações desconhecidas. |
publishDate |
2001 |
dc.date.none.fl_str_mv |
2001-10-23 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012018-144536/ |
url |
http://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012018-144536/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815257123983982592 |