Data Mining no Processo de Extração de Conhecimento de Bases de Dados
Autor(a) principal: | |
---|---|
Data de Publicação: | 1998 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | http://www.teses.usp.br/teses/disponiveis/55/55134/tde-15032018-150606/ |
Resumo: | Nesta última década, houve um grande crescimento na capacidade de gerar e coletar dados, devido principalmente a três fatores: primeiro, ao constante aumento do poder de processamento dos computadores; segundo, ao armazenamento continuo de grande quantidade de dados a um baixo custo; e por último, à introdução de novas e melhores tecnologias relacionadas ao processamento e transmissão de dados. Embora os gerenciadores de bases de dados forneçam ferramentas básicas para otimizar o armazenamento e busca em grande quantidade de dados, o fato de como ajudar os humanos a entender e analisar estas grandes estruturas de dados é um problema de dificil solução. Nesse contexto, o Processo de Extração de Conhecimento de Bases de Dados (Knowledge Discovery in Databases KDD) emerge como uma nova tecnologia orientada à compreensão e busca de conhecimento embutido dentro destas grandes massas de dados, fazendo uso, principalmente, de várias técnicas apoiadas na estatística, bases de dados, ferramentas de visualização e Aprendizado de Máquina. De um modo geral, o processo KDD é composto de várias etapas, partindo da definição do domínio, um pré-processamento dos dados, uma etapa de Data Mining (Mineração de Dados) e, finalmente, uma análise e interpretação do conhecimento obtido. Este trabalho visa compreender e delimitar as diferentes etapas dentro do processo KDD, analisando o papel da etapa de Data Mining dentro deste processo. Dois estudos de casos (uma base de dados petroleira e uma base de dados do Programa de Melhoramento Genético da Raça Nelore) foram realizados para este fim. Este trabalho aborda importantes aspectos, principalmente quanto à relevância da discretizaç\'âo de dados contínuos na obtenção de melhores regras de classificação, além de mostrar o processo KDD em uma base de dados real, destacando a problemática encontrada e a importância da presença do especialista do domínio para o êxito deste processo. |
id |
USP_5199190d3a84ee99b8b0fdf2da5e8ee8 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-15032018-150606 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Data Mining no Processo de Extração de Conhecimento de Bases de DadosNot availableNão disponívelNot availableNesta última década, houve um grande crescimento na capacidade de gerar e coletar dados, devido principalmente a três fatores: primeiro, ao constante aumento do poder de processamento dos computadores; segundo, ao armazenamento continuo de grande quantidade de dados a um baixo custo; e por último, à introdução de novas e melhores tecnologias relacionadas ao processamento e transmissão de dados. Embora os gerenciadores de bases de dados forneçam ferramentas básicas para otimizar o armazenamento e busca em grande quantidade de dados, o fato de como ajudar os humanos a entender e analisar estas grandes estruturas de dados é um problema de dificil solução. Nesse contexto, o Processo de Extração de Conhecimento de Bases de Dados (Knowledge Discovery in Databases KDD) emerge como uma nova tecnologia orientada à compreensão e busca de conhecimento embutido dentro destas grandes massas de dados, fazendo uso, principalmente, de várias técnicas apoiadas na estatística, bases de dados, ferramentas de visualização e Aprendizado de Máquina. De um modo geral, o processo KDD é composto de várias etapas, partindo da definição do domínio, um pré-processamento dos dados, uma etapa de Data Mining (Mineração de Dados) e, finalmente, uma análise e interpretação do conhecimento obtido. Este trabalho visa compreender e delimitar as diferentes etapas dentro do processo KDD, analisando o papel da etapa de Data Mining dentro deste processo. Dois estudos de casos (uma base de dados petroleira e uma base de dados do Programa de Melhoramento Genético da Raça Nelore) foram realizados para este fim. Este trabalho aborda importantes aspectos, principalmente quanto à relevância da discretizaç\'âo de dados contínuos na obtenção de melhores regras de classificação, além de mostrar o processo KDD em uma base de dados real, destacando a problemática encontrada e a importância da presença do especialista do domínio para o êxito deste processo.In the last decade, there lias been a large growth in the capacity to generate and collect data, mainly due to three factors: first, the constant increase in the processing power of computers; second, the continuing storage of a large quantities of data at low costs; and last, the introduction of new and better technologies related to processing and transmitting data. Although database management systems offer basic tools for optimizing the storing and searching in large quantities of data, it is still difficult to help humans understand and analyze tese large data structures. In this context, the process of Knowledge Discovery in Databases KDD lias emerged as a new technology oriented towards comprehending and searching for lcnowledge intrinsic to these large masses of data, mostly by using various techniques based on statistics, databases, visualization tools and Machine Learning. Generally spealcing, the KDD process is composed of various phases, starting with the defmition of the domain, pre-processing the data, a phase of Data Miráng and, fmally, analyzing and interpreting the Imowledge that was obtained. This work tries to comprehend and separate the different phases in the KDD process, analyzing the role of the Data Mining phase in this process. Two case studies (one of a petroleuirt database and another of a database for the Program of Genetic Improving for the Nelore Breed) were made to emphasize this point. This work also loolcs at some important aspects, such as the relevance of discretizing continuous data so as to obtain better classification mies, as well as showing the KDD process applied to a real database, indicating the problems that were found and the importance of the presence of a domain expert for this process to be successful.Biblioteca Digitais de Teses e Dissertações da USPRezende, Solange OliveiraFelix, Luis Carlos Molina1998-08-19info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/55/55134/tde-15032018-150606/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2018-07-19T20:50:39Zoai:teses.usp.br:tde-15032018-150606Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212018-07-19T20:50:39Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Data Mining no Processo de Extração de Conhecimento de Bases de Dados Not available |
title |
Data Mining no Processo de Extração de Conhecimento de Bases de Dados |
spellingShingle |
Data Mining no Processo de Extração de Conhecimento de Bases de Dados Felix, Luis Carlos Molina Não disponível Not available |
title_short |
Data Mining no Processo de Extração de Conhecimento de Bases de Dados |
title_full |
Data Mining no Processo de Extração de Conhecimento de Bases de Dados |
title_fullStr |
Data Mining no Processo de Extração de Conhecimento de Bases de Dados |
title_full_unstemmed |
Data Mining no Processo de Extração de Conhecimento de Bases de Dados |
title_sort |
Data Mining no Processo de Extração de Conhecimento de Bases de Dados |
author |
Felix, Luis Carlos Molina |
author_facet |
Felix, Luis Carlos Molina |
author_role |
author |
dc.contributor.none.fl_str_mv |
Rezende, Solange Oliveira |
dc.contributor.author.fl_str_mv |
Felix, Luis Carlos Molina |
dc.subject.por.fl_str_mv |
Não disponível Not available |
topic |
Não disponível Not available |
description |
Nesta última década, houve um grande crescimento na capacidade de gerar e coletar dados, devido principalmente a três fatores: primeiro, ao constante aumento do poder de processamento dos computadores; segundo, ao armazenamento continuo de grande quantidade de dados a um baixo custo; e por último, à introdução de novas e melhores tecnologias relacionadas ao processamento e transmissão de dados. Embora os gerenciadores de bases de dados forneçam ferramentas básicas para otimizar o armazenamento e busca em grande quantidade de dados, o fato de como ajudar os humanos a entender e analisar estas grandes estruturas de dados é um problema de dificil solução. Nesse contexto, o Processo de Extração de Conhecimento de Bases de Dados (Knowledge Discovery in Databases KDD) emerge como uma nova tecnologia orientada à compreensão e busca de conhecimento embutido dentro destas grandes massas de dados, fazendo uso, principalmente, de várias técnicas apoiadas na estatística, bases de dados, ferramentas de visualização e Aprendizado de Máquina. De um modo geral, o processo KDD é composto de várias etapas, partindo da definição do domínio, um pré-processamento dos dados, uma etapa de Data Mining (Mineração de Dados) e, finalmente, uma análise e interpretação do conhecimento obtido. Este trabalho visa compreender e delimitar as diferentes etapas dentro do processo KDD, analisando o papel da etapa de Data Mining dentro deste processo. Dois estudos de casos (uma base de dados petroleira e uma base de dados do Programa de Melhoramento Genético da Raça Nelore) foram realizados para este fim. Este trabalho aborda importantes aspectos, principalmente quanto à relevância da discretizaç\'âo de dados contínuos na obtenção de melhores regras de classificação, além de mostrar o processo KDD em uma base de dados real, destacando a problemática encontrada e a importância da presença do especialista do domínio para o êxito deste processo. |
publishDate |
1998 |
dc.date.none.fl_str_mv |
1998-08-19 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://www.teses.usp.br/teses/disponiveis/55/55134/tde-15032018-150606/ |
url |
http://www.teses.usp.br/teses/disponiveis/55/55134/tde-15032018-150606/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256987538030592 |