Descoberta automatizada de associações com o uso de algoritmo Apriori como técnica de mineração de dados

Detalhes bibliográficos
Autor(a) principal: ALMEIDA, Derciley Cunha de
Data de Publicação: 2011
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFG
Texto Completo: http://repositorio.bc.ufg.br/tede/handle/tde/966
Resumo: Nowadays, the use of modern information systems allows the storage and management of increasingly large amounts of data. On the other hand, the full analysis and the maximum extraction of useful information from this universe of available data present considerable challenges in view of inherent human limitations. This dissertation deals with the subject of data mining, which is the use of technology resources in order to extract information from databases in an automated way. One of the possibilities offered by data mining technologies is the automated search for possible associations within data. Information about such associations can be useful for understanding cause and effect relationships between the involved variables in data analysis for decision making. There are several data mining techniques and many of them can be used for discovering associations. The main goal of this work is to study a particular method for automated search of associations called Apriori , evaluating its capabilities and outcomes. The study focuses on the problem of improving the Apriori algorithm results, taking into consideration that the results of the data mining process might be improved if the data are prepared specifically for Apriori application. The conclusions are drawn from a case study in which the Apriori algorithm was applied to a database with information on drug distribution at a health institute. The results of two experiments are considered in order to evaluate the influence of data preprocessing on the Apriori algorithm's performance. It was found that the Apriori algorithm yields satisfactory results on the discovery of association in data; however, for best results, it is advisable that the data be prepared in advance, specifically for the Apriori application, otherwise many associations in the database might be left undiscovered.
id UFG-2_23e75f7c414be08ca0b2646a3fb3068e
oai_identifier_str oai:repositorio.bc.ufg.br:tde/966
network_acronym_str UFG-2
network_name_str Repositório Institucional da UFG
repository_id_str
spelling BRITO, Leonardo da Cunhahttp://lattes.cnpq.br/6660680440182900http://lattes.cnpq.br/5388621760351258ALMEIDA, Derciley Cunha de2014-07-29T15:08:17Z2011-11-032011-02-25ALMEIDA, Derciley Cunha de. Automatic discovery of associations by Apriori data mining technique. 2011. 174 f. Dissertação (Mestrado em Engenharia) - Universidade Federal de Goiás, Goiânia, 2011.http://repositorio.bc.ufg.br/tede/handle/tde/966Nowadays, the use of modern information systems allows the storage and management of increasingly large amounts of data. On the other hand, the full analysis and the maximum extraction of useful information from this universe of available data present considerable challenges in view of inherent human limitations. This dissertation deals with the subject of data mining, which is the use of technology resources in order to extract information from databases in an automated way. One of the possibilities offered by data mining technologies is the automated search for possible associations within data. Information about such associations can be useful for understanding cause and effect relationships between the involved variables in data analysis for decision making. There are several data mining techniques and many of them can be used for discovering associations. The main goal of this work is to study a particular method for automated search of associations called Apriori , evaluating its capabilities and outcomes. The study focuses on the problem of improving the Apriori algorithm results, taking into consideration that the results of the data mining process might be improved if the data are prepared specifically for Apriori application. The conclusions are drawn from a case study in which the Apriori algorithm was applied to a database with information on drug distribution at a health institute. The results of two experiments are considered in order to evaluate the influence of data preprocessing on the Apriori algorithm's performance. It was found that the Apriori algorithm yields satisfactory results on the discovery of association in data; however, for best results, it is advisable that the data be prepared in advance, specifically for the Apriori application, otherwise many associations in the database might be left undiscovered.Atualmente é possível o armazenamento e o gerenciamento de grandes quantidades de dados, através de modernos sistemas informatizados. Por outro lado, a análise completa e a extração do máximo de informações desse universo de dados disponíveis passaram a ser um grande desafio, diante das limitações próprias de um ser humano. Essa dissertação aborda o tema mineração de dados, também muito conhecido pelo termo em inglês data mining. Trata-se da extração de informações de bases de dados de forma automatizada, com o uso de recursos tecnológicos. Uma das possibilidades que as tecnologias de data mining oferecem é a busca automatizada de possíveis associações existentes entre dados. As informações sobre associações entre dados podem ser muito úteis para se compreender possíveis relações de causa e efeito entre muitas variáveis envolvidas em estudos e análises de dados para tomada de decisões. Há várias técnicas de mineração de dados e muitas podem ser utilizadas para descoberta de associações. O principal objetivo deste trabalho é estudar mais especificamente o método de busca automatizada de associações conhecido como Apriori de forma a avaliar sua sistemática, capacidade e resultados. O estudo é direcionado por um problema que está relacionado à busca pelo aprimoramento dos resultados gerados pelo algoritmo Apriori sob a premissa de que uma preparação de dados específica e direcionada para o uso do algoritmo pode aprimorar os resultados do processo de mineração de dados. As conclusões são extraídas de um estudo de caso sobre a aplicação do algoritmo Apriori em uma base de dados com informações sobre fornecimento de medicamentos de uma unidade de saúde. São avaliados e comparados os resultados de três experimentos para se verificar a influência de uma preparação de dados no desempenho do algoritmo. Ficou evidenciado que o algoritmo Apriori alcança resultados satisfatórios na tarefa de busca por associações entre dados, no entanto, é recomendável uma preparação específica desses dados para que a aplicação do algoritmo alcance melhores resultados ou muitas associações existentes podem não ser encontradas.Made available in DSpace on 2014-07-29T15:08:17Z (GMT). No. of bitstreams: 1 Dissertacao Derciley Cunha de Almeida.pdf: 2389648 bytes, checksum: c4c207dc1855a4a0e99ee3eeed7c28b9 (MD5) Previous issue date: 2011-02-25application/pdfhttp://repositorio.bc.ufg.br/TEDE/retrieve/3481/Dissertacao%20Derciley%20Cunha%20de%20Almeida.pdf.jpgporUniversidade Federal de GoiásMestrado em Engenharia Elétrica e de ComputaçãoUFGBREngenharia1. Mineração de dados; 2. Algoritmo Apriori; 3.Descoberta de associaçõesMineração de dadosDescoberta de associaçõesAprioriBanco de dadosWEKAData miningAssociation discoveryAprioriDatabasesWEKACNPQ::ENGENHARIASDescoberta automatizada de associações com o uso de algoritmo Apriori como técnica de mineração de dadosAutomatic discovery of associations by Apriori data mining techniqueinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGORIGINALDissertacao Derciley Cunha de Almeida.pdfapplication/pdf2389648http://repositorio.bc.ufg.br/tede/bitstreams/8a63b15a-0dca-4109-a1f8-ea83145e70ff/downloadc4c207dc1855a4a0e99ee3eeed7c28b9MD51THUMBNAILDissertacao Derciley Cunha de Almeida.pdf.jpgDissertacao Derciley Cunha de Almeida.pdf.jpgGenerated Thumbnailimage/jpeg4264http://repositorio.bc.ufg.br/tede/bitstreams/db1e3ca3-904d-4fdc-969a-1b3e2d0292e0/download57c257a1adc6d858cba7d0d9f4130788MD52tde/9662014-07-30 03:05:54.376open.accessoai:repositorio.bc.ufg.br:tde/966http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttp://repositorio.bc.ufg.br/oai/requesttasesdissertacoes.bc@ufg.bropendoar:2014-07-30T06:05:54Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)false
dc.title.por.fl_str_mv Descoberta automatizada de associações com o uso de algoritmo Apriori como técnica de mineração de dados
dc.title.alternative.eng.fl_str_mv Automatic discovery of associations by Apriori data mining technique
title Descoberta automatizada de associações com o uso de algoritmo Apriori como técnica de mineração de dados
spellingShingle Descoberta automatizada de associações com o uso de algoritmo Apriori como técnica de mineração de dados
ALMEIDA, Derciley Cunha de
1. Mineração de dados; 2. Algoritmo Apriori; 3.Descoberta de associações
Mineração de dados
Descoberta de associações
Apriori
Banco de dados
WEKA
Data mining
Association discovery
Apriori
Databases
WEKA
CNPQ::ENGENHARIAS
title_short Descoberta automatizada de associações com o uso de algoritmo Apriori como técnica de mineração de dados
title_full Descoberta automatizada de associações com o uso de algoritmo Apriori como técnica de mineração de dados
title_fullStr Descoberta automatizada de associações com o uso de algoritmo Apriori como técnica de mineração de dados
title_full_unstemmed Descoberta automatizada de associações com o uso de algoritmo Apriori como técnica de mineração de dados
title_sort Descoberta automatizada de associações com o uso de algoritmo Apriori como técnica de mineração de dados
author ALMEIDA, Derciley Cunha de
author_facet ALMEIDA, Derciley Cunha de
author_role author
dc.contributor.advisor1.fl_str_mv BRITO, Leonardo da Cunha
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6660680440182900
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/5388621760351258
dc.contributor.author.fl_str_mv ALMEIDA, Derciley Cunha de
contributor_str_mv BRITO, Leonardo da Cunha
dc.subject.por.fl_str_mv 1. Mineração de dados; 2. Algoritmo Apriori; 3.Descoberta de associações
Mineração de dados
Descoberta de associações
Apriori
Banco de dados
WEKA
topic 1. Mineração de dados; 2. Algoritmo Apriori; 3.Descoberta de associações
Mineração de dados
Descoberta de associações
Apriori
Banco de dados
WEKA
Data mining
Association discovery
Apriori
Databases
WEKA
CNPQ::ENGENHARIAS
dc.subject.eng.fl_str_mv Data mining
Association discovery
Apriori
Databases
WEKA
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS
description Nowadays, the use of modern information systems allows the storage and management of increasingly large amounts of data. On the other hand, the full analysis and the maximum extraction of useful information from this universe of available data present considerable challenges in view of inherent human limitations. This dissertation deals with the subject of data mining, which is the use of technology resources in order to extract information from databases in an automated way. One of the possibilities offered by data mining technologies is the automated search for possible associations within data. Information about such associations can be useful for understanding cause and effect relationships between the involved variables in data analysis for decision making. There are several data mining techniques and many of them can be used for discovering associations. The main goal of this work is to study a particular method for automated search of associations called Apriori , evaluating its capabilities and outcomes. The study focuses on the problem of improving the Apriori algorithm results, taking into consideration that the results of the data mining process might be improved if the data are prepared specifically for Apriori application. The conclusions are drawn from a case study in which the Apriori algorithm was applied to a database with information on drug distribution at a health institute. The results of two experiments are considered in order to evaluate the influence of data preprocessing on the Apriori algorithm's performance. It was found that the Apriori algorithm yields satisfactory results on the discovery of association in data; however, for best results, it is advisable that the data be prepared in advance, specifically for the Apriori application, otherwise many associations in the database might be left undiscovered.
publishDate 2011
dc.date.available.fl_str_mv 2011-11-03
dc.date.issued.fl_str_mv 2011-02-25
dc.date.accessioned.fl_str_mv 2014-07-29T15:08:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ALMEIDA, Derciley Cunha de. Automatic discovery of associations by Apriori data mining technique. 2011. 174 f. Dissertação (Mestrado em Engenharia) - Universidade Federal de Goiás, Goiânia, 2011.
dc.identifier.uri.fl_str_mv http://repositorio.bc.ufg.br/tede/handle/tde/966
identifier_str_mv ALMEIDA, Derciley Cunha de. Automatic discovery of associations by Apriori data mining technique. 2011. 174 f. Dissertação (Mestrado em Engenharia) - Universidade Federal de Goiás, Goiânia, 2011.
url http://repositorio.bc.ufg.br/tede/handle/tde/966
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Goiás
dc.publisher.program.fl_str_mv Mestrado em Engenharia Elétrica e de Computação
dc.publisher.initials.fl_str_mv UFG
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Engenharia
publisher.none.fl_str_mv Universidade Federal de Goiás
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFG
instname:Universidade Federal de Goiás (UFG)
instacron:UFG
instname_str Universidade Federal de Goiás (UFG)
instacron_str UFG
institution UFG
reponame_str Repositório Institucional da UFG
collection Repositório Institucional da UFG
bitstream.url.fl_str_mv http://repositorio.bc.ufg.br/tede/bitstreams/8a63b15a-0dca-4109-a1f8-ea83145e70ff/download
http://repositorio.bc.ufg.br/tede/bitstreams/db1e3ca3-904d-4fdc-969a-1b3e2d0292e0/download
bitstream.checksum.fl_str_mv c4c207dc1855a4a0e99ee3eeed7c28b9
57c257a1adc6d858cba7d0d9f4130788
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)
repository.mail.fl_str_mv tasesdissertacoes.bc@ufg.br
_version_ 1793965505207336960