Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes

Detalhes bibliográficos
Autor(a) principal: Soncco Álvarez, José Luis
Data de Publicação: 2017
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio.unb.br/handle/10482/23520
http://dx.doi.org/10.26512/2017.03.T.23520
Resumo: Tese (doutorado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2017.
id UNB_581b1358f42abb58727177ce2b31360a
oai_identifier_str oai:repositorio.unb.br:10482/23520
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genesAlgoritmos genéticosFilogeniaTese (doutorado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2017.O cálculo de distâncias evolutivas, como as distâncias de reversão e double cut and join, entre a ordem dos genes de dois organismos e um problema combinatório complexo. Este cenário pode ficar ainda mais complicado se quisermos construir árvores filogenéticas, visto que a maioria das abordagens da literatura primeiro solucionam o problema da mediana de três genomas, o qual foi demonstrado ser NP-Difícil para vários modelos evolutivos. Neste trabalho propomos vários algoritmos evolutivos para o problema de ordenação de permutações (sem sinal) por reversões, cuja saída e a distancia de reversão. Estes algoritmos são baseados em um algoritmo genético simples, sobre o qual foram incorporados varias heurísticas como busca local, busca por oposição, e eliminação de pontos de quebra. Experimentos foram realizados usando diferentes dados (permutações) baseados na ordem dos genes, os quais foram gerados artificialmente (de forma aleatória) e também a partir de dados biológicos. Dentre estes algoritmos os que melhores resultados tem para casos práticos, ou seja, permutações de comprimento ate 120, são os chamados AMBO e AMBO-Híbrido. Estes resultados foram validados usando testes estatísticos como Friedman e Holm. Adicionalmente, foi implementado um software para construir arvores filogenéticas chamado de HELPHY, que toma como entrada dados baseados na ordem dos genes (permutações com sinal). Primeiro foi proposto um algoritmo guloso para o problema da pequena filogenia, cujo objetivo e calcular o custo de uma determinada árvore. Logo, para o problema da grande filogenia foi proposta uma abordagem baseada em busca em vizinhança variável, cujo objetivo e explorar o espaço de soluções de estruturas de árvores. Experimentos mostraram que HELPHY conseguiu melhorar o tempo de execução para encontrar árvores com bons escores (distância de reversão) para o dataset Campanulaceae; além disso, uma nova árvore tendo o melhor escore (distância double cut and join) na literatura foi encontrado para o dataset Hemiascomycetes.Calculating evolutionary distances, such as the reversal distance or the double cut and join distance, between the gene orders of two organisms is a complex combinatory problem. This scenario can be even more complicated if we want to build phylogenetic trees, since most of the approaches in the literature first solves the median problem for three genomes, which was shown to be NP-Hard for various evolutionary models. In this work, we are proposing several evolutionary algorithms for the problem of sorting (unsigned) permutations by reversals, whose output is the reversal distance. These algorithms are based on a simple genetic algorithm, on which were embedded different heuristics such as local search, opposition-based learning, and elimination of breakpoints. Experiments were performed using different types of data (permutations) based on gene orders which were generated artificially (in a random way) and also from biological data. From these algorithms, the ones with the best results for practical cases, that is, permutations of length up to 120, are called as AMBO and AMBO-Hibrido. These results were validated by applying the Friedman and Holm statistical tests. Moreover, a software called HELPHY for building phylogenetic trees was implemented, which takes as input data based on gene order (signed permutations). First, an greedy algorithm was proposed for the small phylogeny problem, whose aim is to calculate the cost (score) of a given tree structure. Then, an approach based on variable neighborhood search was proposed for the large phylogeny problem, whose aim is to explore the search space of tree structures. Results of the experiments showed that HELPHY improved the execution time for finding good scores (reversal distance) for the dataset Campanulaceae; besides, a new tree structure with the best score (double cut and join distance) in the literature was found for the dataset Hemiascomycetes.Instituto de Ciências Exatas (IE)Departamento de Ciência da Computação (IE CIC)Programa de Pós-Graduação em InformáticaAyala-Rincón, MauricioSoncco Álvarez, José Luis2017-05-17T14:03:21Z2017-05-17T14:03:21Z2017-05-172017-03-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfSONNCO ÁLVAREZ, José Luis. Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes. 2017. x, 93 f., il. Tese (Doutorado em Informática)—Universidade de Brasília, Brasília, 2017.http://repositorio.unb.br/handle/10482/23520http://dx.doi.org/10.26512/2017.03.T.23520A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-03-14T15:43:39Zoai:repositorio.unb.br:10482/23520Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-03-14T15:43:39Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes
title Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes
spellingShingle Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes
Soncco Álvarez, José Luis
Algoritmos genéticos
Filogenia
title_short Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes
title_full Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes
title_fullStr Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes
title_full_unstemmed Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes
title_sort Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes
author Soncco Álvarez, José Luis
author_facet Soncco Álvarez, José Luis
author_role author
dc.contributor.none.fl_str_mv Ayala-Rincón, Mauricio
dc.contributor.author.fl_str_mv Soncco Álvarez, José Luis
dc.subject.por.fl_str_mv Algoritmos genéticos
Filogenia
topic Algoritmos genéticos
Filogenia
description Tese (doutorado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2017.
publishDate 2017
dc.date.none.fl_str_mv 2017-05-17T14:03:21Z
2017-05-17T14:03:21Z
2017-05-17
2017-03-03
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SONNCO ÁLVAREZ, José Luis. Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes. 2017. x, 93 f., il. Tese (Doutorado em Informática)—Universidade de Brasília, Brasília, 2017.
http://repositorio.unb.br/handle/10482/23520
http://dx.doi.org/10.26512/2017.03.T.23520
identifier_str_mv SONNCO ÁLVAREZ, José Luis. Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes. 2017. x, 93 f., il. Tese (Doutorado em Informática)—Universidade de Brasília, Brasília, 2017.
url http://repositorio.unb.br/handle/10482/23520
http://dx.doi.org/10.26512/2017.03.T.23520
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1810580706179416064