Programação Genética Aplicada no Processo de Descoberta de Conhecimento em Bases de Dados de Redes de Pesquisa.

Detalhes bibliográficos
Autor(a) principal: DUARTE, Kedma Batista
Data de Publicação: 2010
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFG
Texto Completo: http://repositorio.bc.ufg.br/tede/handle/tde/964
Resumo: The Genetic Programming (GP) is a heuristic algorithm for Data Mining (DM), which can be applied to the classification task. This is a method of evolutionary computing inspired in the mechanisms of natural selection theory of Charles Darwin, declared in 1859 in his book "The Origin of Species." From an initial population, the method search over a number of generations to find solutions adapted to the environment of problem. The PG method was proposed in 1990 by John Koza, who demonstrated in one of its applications, the induction in formation of decision trees in the process of data classification. Within this context, the study developed in this work has as main objective the investigation of the concepts of PG and its application on a database of scientific collaboration networks, helping as a management tool in prospective studies of trends for the establishment of common axes in public policy of Science, Technology and Innovation (STI), focusing on regional development. The method is applied on a set of attributes, sorting them in order to identify similarity relationships between groups of researchers that comprise the network. The study involves the concepts of Knowledge Discovery in Databases (KDD) and Data Mining (DM). Networks of Scientific Collaboration, or Networks Research, are inserted in the context of small groups of social networks, the environment is dynamic due to the easy of information exchange and links between individuals, favoring the formation of new groups, which makes the growth of the network unlimited. "The combination of these groups, generated by the relationships between them, appears as a case of multi-criteria decision, granting the application of some complexity. In this sense, it is intended to apply the method of PG for generation of classification rules that lead to the discovery of groups of researchers with similar traits, which in a planned process could be induced to form groups strengthened and consolidated. The study helps to exploit the potential of genetic programming as a classifier algorithm, as well as use it as a method to build tools to support planning and decision making in STI.
id UFG-2_b3436ad4f656ec5d8e5cbd85f3a8c438
oai_identifier_str oai:repositorio.bc.ufg.br:tde/964
network_acronym_str UFG-2
network_name_str Repositório Institucional da UFG
repository_id_str
spelling BRITO, Leonardo da Cunhahttp://lattes.cnpq.br/6660680440182900http://lattes.cnpq.br/7565342982159217DUARTE, Kedma Batista2014-07-29T15:08:16Z2011-05-192010-12-20DUARTE, Kedma Batista. Genetic Programming Apllied in the Process of Knowledge Discovery in Databases for Research Networks.. 2010. 112 f. Dissertação (Mestrado em Engenharia) - Universidade Federal de Goiás, Goiânia, 2010.http://repositorio.bc.ufg.br/tede/handle/tde/964The Genetic Programming (GP) is a heuristic algorithm for Data Mining (DM), which can be applied to the classification task. This is a method of evolutionary computing inspired in the mechanisms of natural selection theory of Charles Darwin, declared in 1859 in his book "The Origin of Species." From an initial population, the method search over a number of generations to find solutions adapted to the environment of problem. The PG method was proposed in 1990 by John Koza, who demonstrated in one of its applications, the induction in formation of decision trees in the process of data classification. Within this context, the study developed in this work has as main objective the investigation of the concepts of PG and its application on a database of scientific collaboration networks, helping as a management tool in prospective studies of trends for the establishment of common axes in public policy of Science, Technology and Innovation (STI), focusing on regional development. The method is applied on a set of attributes, sorting them in order to identify similarity relationships between groups of researchers that comprise the network. The study involves the concepts of Knowledge Discovery in Databases (KDD) and Data Mining (DM). Networks of Scientific Collaboration, or Networks Research, are inserted in the context of small groups of social networks, the environment is dynamic due to the easy of information exchange and links between individuals, favoring the formation of new groups, which makes the growth of the network unlimited. "The combination of these groups, generated by the relationships between them, appears as a case of multi-criteria decision, granting the application of some complexity. In this sense, it is intended to apply the method of PG for generation of classification rules that lead to the discovery of groups of researchers with similar traits, which in a planned process could be induced to form groups strengthened and consolidated. The study helps to exploit the potential of genetic programming as a classifier algorithm, as well as use it as a method to build tools to support planning and decision making in STI.A Programação Genética (PG) é um algoritmo heurístico de Mineração de Dados (MD), quepode ser aplicado na tarefa de classificação. Trata-se de um método da Computação Evolutiva inspirado nos mecanismos de seleção natural, da teoria de Charles Darwin, declarada em 1859 em seu livro A Origem das Espécies . A partir de uma população inicial, o método busca ao longo de um conjunto de gerações a descoberta de soluções bem adaptadas ao ambiente do problema. O método de PG foi proposto por John Koza em 1990, que demonstrou em uma de suas aplicações, a indução na formação de árvores de decisão em processos de classificação de dados. Dentro deste contexto, o estudo desenvolvido neste trabalho tem como objetivo principal a investigação dos conceitos de PG e sua aplicação sobre uma base de dados de Redes de Colaboração Científica, auxiliando como ferramenta de gestão em estudos prospectivos de tendências para o estabelecimento de eixos comuns em políticas públicas de Ciência, Tecnologia e Inovação (CT&I), com foco em desenvolvimento regional. O método é aplicado sobre um conjunto de atributos, classificando-os de forma a identificar relações de similaridade entre os grupos de pesquisadores que compõem a rede. O estudo envolve conceitos de Descoberta do Conhecimento em Bases de Dados (DCBD) e Mineração de Dados (MD). As Redes de Colaboração Científica, ou Redes de Pesquisa, estão inseridas no contexto dos pequenos grupos das Redes Sociais, o ambiente é dinâmico devido à facilidade para troca de informações e articulação entre os indivíduos, favorecendo a formação de novos grupos, fato que torna ilimitado o crescimento da Rede. A combinação das características desses grupos, gerada pelos relacionamentos entre eles, configura-se como um caso de decisão multi-critério, dotando a aplicação de certa complexidade. Neste sentido, pretende-se com a aplicação do método da PG a geração de regras de classificação que levem à descoberta de grupos de pesquisadores com características similares, que em um processo planejado poderiam ser induzidos à formação de grupos fortalecidos e consolidados. O estudo contribui no sentido de explorar o potencial da Programação Genética como um algoritmo classificador, bem como, usá-lo como método na construção de ferramentas de apoio ao planejamento e tomada de decisão em CT&I.Made available in DSpace on 2014-07-29T15:08:16Z (GMT). No. of bitstreams: 1 Tese de Kedma Batista Duarte.pdf: 2986348 bytes, checksum: b08f936c5937365d2b7493f4db0f0b88 (MD5) Previous issue date: 2010-12-20application/pdfhttp://repositorio.bc.ufg.br/TEDE/retrieve/3458/Tese%20de%20Kedma%20%20Batista%20Duarte.pdf.jpgporUniversidade Federal de GoiásMestrado em Engenharia Elétrica e de ComputaçãoUFGBREngenhariaComputação EvolutivaDescoberta do ConhecimentoMineração de DadosProgramação GenéticaRedes de Pesquisa.1. Programação genética (Computação) 2. Mineração de dados (Computação) 3. Evolução (Biologia)Evolutionary ComputationDiscovery of KnowledgeData MiningGenetic ProgrammingNetworks Research.CNPQ::ENGENHARIASProgramação Genética Aplicada no Processo de Descoberta de Conhecimento em Bases de Dados de Redes de Pesquisa.Genetic Programming Apllied in the Process of Knowledge Discovery in Databases for Research Networks.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGORIGINALTese de Kedma Batista Duarte.pdfapplication/pdf2986348http://repositorio.bc.ufg.br/tede/bitstreams/22eea13c-4d3f-4da1-9103-9d39cde89fbf/downloadb08f936c5937365d2b7493f4db0f0b88MD51THUMBNAILTese de Kedma Batista Duarte.pdf.jpgTese de Kedma Batista Duarte.pdf.jpgGenerated Thumbnailimage/jpeg1943http://repositorio.bc.ufg.br/tede/bitstreams/3efeaeb5-16f2-40df-b2b9-b839536835a0/downloadcc73c4c239a4c332d642ba1e7c7a9fb2MD52tde/9642014-07-30 03:05:39.242open.accessoai:repositorio.bc.ufg.br:tde/964http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttp://repositorio.bc.ufg.br/oai/requesttasesdissertacoes.bc@ufg.bropendoar:2014-07-30T06:05:39Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)false
dc.title.por.fl_str_mv Programação Genética Aplicada no Processo de Descoberta de Conhecimento em Bases de Dados de Redes de Pesquisa.
dc.title.alternative.eng.fl_str_mv Genetic Programming Apllied in the Process of Knowledge Discovery in Databases for Research Networks.
title Programação Genética Aplicada no Processo de Descoberta de Conhecimento em Bases de Dados de Redes de Pesquisa.
spellingShingle Programação Genética Aplicada no Processo de Descoberta de Conhecimento em Bases de Dados de Redes de Pesquisa.
DUARTE, Kedma Batista
Computação Evolutiva
Descoberta do Conhecimento
Mineração de Dados
Programação Genética
Redes de Pesquisa.
1. Programação genética (Computação) 2. Mineração de dados (Computação) 3. Evolução (Biologia)
Evolutionary Computation
Discovery of Knowledge
Data Mining
Genetic Programming
Networks Research.
CNPQ::ENGENHARIAS
title_short Programação Genética Aplicada no Processo de Descoberta de Conhecimento em Bases de Dados de Redes de Pesquisa.
title_full Programação Genética Aplicada no Processo de Descoberta de Conhecimento em Bases de Dados de Redes de Pesquisa.
title_fullStr Programação Genética Aplicada no Processo de Descoberta de Conhecimento em Bases de Dados de Redes de Pesquisa.
title_full_unstemmed Programação Genética Aplicada no Processo de Descoberta de Conhecimento em Bases de Dados de Redes de Pesquisa.
title_sort Programação Genética Aplicada no Processo de Descoberta de Conhecimento em Bases de Dados de Redes de Pesquisa.
author DUARTE, Kedma Batista
author_facet DUARTE, Kedma Batista
author_role author
dc.contributor.advisor1.fl_str_mv BRITO, Leonardo da Cunha
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6660680440182900
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/7565342982159217
dc.contributor.author.fl_str_mv DUARTE, Kedma Batista
contributor_str_mv BRITO, Leonardo da Cunha
dc.subject.por.fl_str_mv Computação Evolutiva
Descoberta do Conhecimento
Mineração de Dados
Programação Genética
Redes de Pesquisa.
1. Programação genética (Computação) 2. Mineração de dados (Computação) 3. Evolução (Biologia)
topic Computação Evolutiva
Descoberta do Conhecimento
Mineração de Dados
Programação Genética
Redes de Pesquisa.
1. Programação genética (Computação) 2. Mineração de dados (Computação) 3. Evolução (Biologia)
Evolutionary Computation
Discovery of Knowledge
Data Mining
Genetic Programming
Networks Research.
CNPQ::ENGENHARIAS
dc.subject.eng.fl_str_mv Evolutionary Computation
Discovery of Knowledge
Data Mining
Genetic Programming
Networks Research.
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS
description The Genetic Programming (GP) is a heuristic algorithm for Data Mining (DM), which can be applied to the classification task. This is a method of evolutionary computing inspired in the mechanisms of natural selection theory of Charles Darwin, declared in 1859 in his book "The Origin of Species." From an initial population, the method search over a number of generations to find solutions adapted to the environment of problem. The PG method was proposed in 1990 by John Koza, who demonstrated in one of its applications, the induction in formation of decision trees in the process of data classification. Within this context, the study developed in this work has as main objective the investigation of the concepts of PG and its application on a database of scientific collaboration networks, helping as a management tool in prospective studies of trends for the establishment of common axes in public policy of Science, Technology and Innovation (STI), focusing on regional development. The method is applied on a set of attributes, sorting them in order to identify similarity relationships between groups of researchers that comprise the network. The study involves the concepts of Knowledge Discovery in Databases (KDD) and Data Mining (DM). Networks of Scientific Collaboration, or Networks Research, are inserted in the context of small groups of social networks, the environment is dynamic due to the easy of information exchange and links between individuals, favoring the formation of new groups, which makes the growth of the network unlimited. "The combination of these groups, generated by the relationships between them, appears as a case of multi-criteria decision, granting the application of some complexity. In this sense, it is intended to apply the method of PG for generation of classification rules that lead to the discovery of groups of researchers with similar traits, which in a planned process could be induced to form groups strengthened and consolidated. The study helps to exploit the potential of genetic programming as a classifier algorithm, as well as use it as a method to build tools to support planning and decision making in STI.
publishDate 2010
dc.date.issued.fl_str_mv 2010-12-20
dc.date.available.fl_str_mv 2011-05-19
dc.date.accessioned.fl_str_mv 2014-07-29T15:08:16Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv DUARTE, Kedma Batista. Genetic Programming Apllied in the Process of Knowledge Discovery in Databases for Research Networks.. 2010. 112 f. Dissertação (Mestrado em Engenharia) - Universidade Federal de Goiás, Goiânia, 2010.
dc.identifier.uri.fl_str_mv http://repositorio.bc.ufg.br/tede/handle/tde/964
identifier_str_mv DUARTE, Kedma Batista. Genetic Programming Apllied in the Process of Knowledge Discovery in Databases for Research Networks.. 2010. 112 f. Dissertação (Mestrado em Engenharia) - Universidade Federal de Goiás, Goiânia, 2010.
url http://repositorio.bc.ufg.br/tede/handle/tde/964
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Goiás
dc.publisher.program.fl_str_mv Mestrado em Engenharia Elétrica e de Computação
dc.publisher.initials.fl_str_mv UFG
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Engenharia
publisher.none.fl_str_mv Universidade Federal de Goiás
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFG
instname:Universidade Federal de Goiás (UFG)
instacron:UFG
instname_str Universidade Federal de Goiás (UFG)
instacron_str UFG
institution UFG
reponame_str Repositório Institucional da UFG
collection Repositório Institucional da UFG
bitstream.url.fl_str_mv http://repositorio.bc.ufg.br/tede/bitstreams/22eea13c-4d3f-4da1-9103-9d39cde89fbf/download
http://repositorio.bc.ufg.br/tede/bitstreams/3efeaeb5-16f2-40df-b2b9-b839536835a0/download
bitstream.checksum.fl_str_mv b08f936c5937365d2b7493f4db0f0b88
cc73c4c239a4c332d642ba1e7c7a9fb2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)
repository.mail.fl_str_mv tasesdissertacoes.bc@ufg.br
_version_ 1793965457612472320