Modelos restritos e intergênicos para a ordenação por reversões e transposições

Detalhes bibliográficos
Autor(a) principal: Oliveira, Andre Rodrigues, 1990-
Data de Publicação: 2019
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1638131
Resumo: Orientadores: Zanoni Dias, Ulisses Martins Dias
id UNICAMP-30_f9d0c0921afb826f4bbf6b1c610912f1
oai_identifier_str oai::1126478
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Modelos restritos e intergênicos para a ordenação por reversões e transposiçõesConstrained and intergenic models for the sorting by reversals and transpositionsRearranjo de genomasBiologia computacionalAlgoritmos de aproximaçãoOrdenação (Computadores)Genome rearrangementsComputational biologyApproximation algorithmsSorting (Electronic computers)Orientadores: Zanoni Dias, Ulisses Martins DiasTese (doutorado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Rearranjos de Genomas são eventos que afetam longos trechos de um genoma durante a evolução. Dentre os rearranjos mais estudados, temos a reversão, que inverte a ordem e a orientação de um bloco consecutivo de genes, e a transposição, que troca a ordem relativa de dois blocos adjacentes. Modelos matemáticos vêm sendo utilizados para estimar a distância evolutiva entre diferentes organismos por rearranjos de genomas. A representação de um genoma se dá, na maioria das vezes, pela atribuição de um número único para cada gene e, ao supor que não existem genes repetidos, essa representação pode ser vista como uma permutação. Supondo que os dois genomas a serem comparados compartilham o mesmo conjunto de genes, calcular a distância evolutiva entre eles se torna o problema de encontrar o menor número de rearranjos necessários que transforma uma permutação em outra. Nesta tese, apresentamos diversos resultados envolvendo problemas de rearranjos de genomas: (i) provas de NP-dificuldade para quatro problemas cuja complexidade era desconhecida; (ii) um algoritmo polinomial exato para um problema cuja complexidade era desconhecida; e (iii) algoritmos de aproximação e provas de NP-dificuldade para problemas onde a representação dos genomas não considera apenas a ordem dos genes. Descrevemos estas contribuições com maior profundidade nos parágrafos a seguir. Dentre os problemas que envolvem rearranjos de genomas, existem quatro versões que permitem o uso de reversões e transposições ao mesmo tempo e que, apesar dos diversos algoritmos propostos nos últimos 20 anos, permaneciam com complexidade desconhecida. A primeira contribuição apresentada é a prova de NP-dificuldade desses quatro problemas. Uma das variações dos problemas de rearranjos de genomas consideram que cada rearranjo pode afetar apenas um pequeno número de genes, também conhecidos como rearranjos curtos e super curtos. Neste contexto, nossa segunda contribuição é a prova de que o único problema cuja complexidade era desconhecida envolvendo reversões super curtas e transposições super curtas admite um algoritmo polinomial exato. A grande maioria das abordagens em problemas de rearranjos existentes na literatura focaram apenas na ordem relativa dos genes de um genoma, desconsiderando outras características importantes existentes no genoma. Recentemente, pesquisadores mostraram que considerar as regiões existentes entre cada par de genes, chamadas de regiões intergênicas, pode resultar em melhores estimadores de distância em dados reais. Desta forma, nossa terceira contribuição investiga a incorporação das regiões intergênicas em modelos já existentes para reversões e transposições, tanto na abordagem sem restrições como na abordagem que considera apenas rearranjos super curtos, onde investigamos diversos algoritmos de aproximação para problemas que são NP-difíceis ou possuem complexidade desconhecidaAbstract: Genome rearrangements are events that affect large stretches of a genome during evolution. Two of the most studied rearrangements are reversals, which reverses the order and orientation of a consecutive block of genes, and transpositions, which exchanges the relative order of two adjacent blocks. Mathematical models have been used to estimate the evolutionary distance between different organisms by genome rearrangements. The representation of a genome is very often made by assigning a unique number to each gene. If we assume no repeated genes, this representation can be seen as a permutation. By considering that the two genomes to be compared share the same set of genes, finding the evolutionary distance between them becomes the problem of finding the smallest number of genome rearrangements needed to transform one permutation into the other. In this thesis, we present several results involving genome rearrangement problems: (i) proofs of NP-hardness for four problems whose complexity was unknown; (ii) an exact polynomial algorithm for a problem whose complexity was unknown; and (iii) approximation algorithms and proofs of NP-hardness for problems where the genome representation carry more information than only the gene order. We describe these contributions in more depth in the following paragraphs. Among the problems involving genome rearrangements, four versions that allow the use of reversals and transpositions at the same time remained with unknown complexity despite the various algorithms proposed in the last 20 years. The first contribution presented is then the proofs of NP-hardness for these four problems. A variant of genome rearrangement problems considers that each rearrangement can affect only a small number of genes, also known as short and super short rearrangements. In this context, our second contribution is proof that the only problem involving super short reversals and super short transpositions whose complexity was unknown admits an exact polynomial algorithm. Most of the approaches for genome rearrangement problems in the literature so far have focused only on the relative order of genes in a genome, disregarding other important features presented in it. Recently, researchers have shown that considering the regions between each pair of genes, called intergenic regions, can result in better distance estimators in real data. Thus, our third contribution investigates the incorporation of intergenic regions in existing models for reversals and transpositions, both in the unrestricted and size restricted versions (i.e. super short operations), where we propose several approximation algorithms for problems that are either NP-hard or with unknown complexityDoutoradoCiência da ComputaçãoDoutor em Ciência da ComputaçãoCAPESCNPQ140466/2018-5[s.n.]Dias, Zanoni, 1975-Dias, Ulisses Martins, 1983-Lintzmayer, Carla NegriWalter, Maria Emília Machado TellesLee, OrlandoTelles, Guilherme PimentelUniversidade Estadual de Campinas. Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASOliveira, Andre Rodrigues, 1990-20192019-12-09T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf1 recurso online (112 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/1638131OLIVEIRA, Andre Rodrigues. Modelos restritos e intergênicos para a ordenação por reversões e transposições. 2019. 1 recurso online (112 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1638131. Acesso em: 15 mai. 2024.https://repositorio.unicamp.br/acervo/detalhe/1126478Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2020-03-05T11:02:05Zoai::1126478Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2020-03-05T11:02:05Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Modelos restritos e intergênicos para a ordenação por reversões e transposições
Constrained and intergenic models for the sorting by reversals and transpositions
title Modelos restritos e intergênicos para a ordenação por reversões e transposições
spellingShingle Modelos restritos e intergênicos para a ordenação por reversões e transposições
Oliveira, Andre Rodrigues, 1990-
Rearranjo de genomas
Biologia computacional
Algoritmos de aproximação
Ordenação (Computadores)
Genome rearrangements
Computational biology
Approximation algorithms
Sorting (Electronic computers)
title_short Modelos restritos e intergênicos para a ordenação por reversões e transposições
title_full Modelos restritos e intergênicos para a ordenação por reversões e transposições
title_fullStr Modelos restritos e intergênicos para a ordenação por reversões e transposições
title_full_unstemmed Modelos restritos e intergênicos para a ordenação por reversões e transposições
title_sort Modelos restritos e intergênicos para a ordenação por reversões e transposições
author Oliveira, Andre Rodrigues, 1990-
author_facet Oliveira, Andre Rodrigues, 1990-
author_role author
dc.contributor.none.fl_str_mv Dias, Zanoni, 1975-
Dias, Ulisses Martins, 1983-
Lintzmayer, Carla Negri
Walter, Maria Emília Machado Telles
Lee, Orlando
Telles, Guilherme Pimentel
Universidade Estadual de Campinas. Instituto de Computação
Programa de Pós-Graduação em Ciência da Computação
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Oliveira, Andre Rodrigues, 1990-
dc.subject.por.fl_str_mv Rearranjo de genomas
Biologia computacional
Algoritmos de aproximação
Ordenação (Computadores)
Genome rearrangements
Computational biology
Approximation algorithms
Sorting (Electronic computers)
topic Rearranjo de genomas
Biologia computacional
Algoritmos de aproximação
Ordenação (Computadores)
Genome rearrangements
Computational biology
Approximation algorithms
Sorting (Electronic computers)
description Orientadores: Zanoni Dias, Ulisses Martins Dias
publishDate 2019
dc.date.none.fl_str_mv 2019
2019-12-09T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1638131
OLIVEIRA, Andre Rodrigues. Modelos restritos e intergênicos para a ordenação por reversões e transposições. 2019. 1 recurso online (112 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1638131. Acesso em: 15 mai. 2024.
url https://hdl.handle.net/20.500.12733/1638131
identifier_str_mv OLIVEIRA, Andre Rodrigues. Modelos restritos e intergênicos para a ordenação por reversões e transposições. 2019. 1 recurso online (112 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1638131. Acesso em: 15 mai. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1126478
Requisitos do sistema: Software para leitura de arquivo em PDF
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
1 recurso online (112 p.) : il., digital, arquivo PDF.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1799138546467995648