Variações do problema de distância de rearranjos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/18489 |
Resumo: | Orientadores: Zanoni Dias, Ulisses Martins Dias |
id |
UNICAMP-30_66c567322a0086e0e990819488dcf42d |
---|---|
oai_identifier_str |
oai::1390745 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Variações do problema de distância de rearranjosOn variants of the genome rearrangement distance problemRearranjo de genomasBiologia computacionalAlgoritmos de aproximaçãoOrdenação (Computadores)Genome rearrangementsComputational biologyApproximation algorithmsSorting (Electronic computers)Orientadores: Zanoni Dias, Ulisses Martins DiasTese (doutorado) - Universidade Estadual de Campinas (UNICAMP), Instituto de ComputaçãoResumo: Considerando um par de genomas de organismos de espécies relacionadas, os problemas de distância de rearranjos têm como objetivo estimar quão distante um deles está em relação ao outro em termos de rearranjos de genomas, que são eventos mutacionais capazes de modificar o material genético ou a posição relativa de segmentos de um genoma. Considerando o Princípio da Máxima Parcimônia, o termo distância, ou ainda distância de rearranjos, é definido como o número mínimo de rearranjos de genomas necessários para transformar um genoma no outro. Os primeiros trabalhos que estudaram a distância de rearranjos assumiram que os genomas comparados possuem o mesmo conjunto de genes (genomas balanceados) e, além disso, apenas a ordem relativa dos genes e suas orientações, quando conhecidas, são utilizadas na representação matemática dos genomas. Essas restrições implicam que é possível transformar um genoma em outro usando apenas rearranjos que não alteram a quantidade de material genético no genoma (rearranjos conservativos). Nesse caso, os genomas são representados como permutações, o que deu origem aos problemas de Ordenação de Permutações por Rearranjos. Os principais problemas de Ordenação de Permutações por Rearranjos consideram DCJs, reversões, transposições, ou a combinação de reversões e transposições, sendo que eles possuem complexidade conhecida. Além desses, foram estudados outros problemas que combinam transposições com um ou mais dos seguintes rearranjos: transposições inversas, revrevs e reversões. Apesar de existirem algoritmos de aproximação na literatura para esses problemas, as complexidades deles permaneciam em aberto. Um dos resultados desta tese é a prova de complexidade desses problemas que combinam transposições com transposições inversas, revrevs e reversões. Além disso, apresentamos um novo algoritmo de 1.375-aproximação para a Ordenação de Permutações por Transposições que possui melhor complexidade de tempo. Com o avanço da área, novos trabalhos começaram a considerar genomas desbalanceados e a incorporar a distribuição dos tamanhos das regiões intergênicas. Ao considerar genomas desbalanceados, é necessário o uso de inserções e deleções para transformar um genoma em outro. Nesta tese, estudamos tanto o problema de Distância de Rearranjos em genomas desbalanceados considerando apenas a sequência de genes e suas orientações (quando conhecidas), quanto o problema de Distância de Rearranjos Intergênicos em genomas desbalanceados, que incorpora os tamanhos das regiões intergênicas na representação dos genomas, além do uso da sequência de genes e suas orientações (quando conhecidas). Apresentamos novas estruturas e conceitos para problemas que envolvem reversões, transposições e a combinação de reversões e transposições, que são usados em provas de complexidade e algoritmos de aproximação. Além disso, realizamos experimentos em genomas sintéticos e em genomas reais, evidenciando a aplicabilidade dos nossos algoritmosAbstract: Considering a pair of genomes from individuals of related species, the goal of genome rearrangement distance problems is to estimate how distant these genomes are from each other based on genome rearrangements, which are mutational events that modify the genetic material or the relative position from segments of a genome. Using the Principe of Parsimony, the term distance, or rearrangement distance, refers to the minimum number of rearrangements necessary to transform one genome into the other. Seminal works in genome rearrangements assumed that both genomes being compared have the same set of genes (balanced genomes) and, furthermore, only the relative order of genes and their orientations, when they are known, are used in the mathematical representation of the genomes. These restrictions imply that it is possible to transform one genome into the other using only conservative rearrangements, which are rearrangements that do not alter the genetic material from a genome. In this case, the genomes are represented as permutations, originating the Sorting Permutations by Rearrangements problems. The main problems of Sorting Permutations by Rearrangements considered DCJs, reversals, transpositions, or the combination of both reversals and transpositions, and these problems have their complexity known. Besides these problems, other ones were studied involving the combination of transpositions with one or more of the following rearrangements: transreversals, revrevs, and reversals. Although there are approximation results for these problems, their complexity remained open. Some of the results of this thesis are the complexity proofs for these problems. Furthermore, we present a new 1.375-approximation algorithm, which has better time complexity, for the Sorting Permutations by Transpositions. As the field has progressed, new works started to consider unbalanced genomes and to incorporate the size distribution of intergenic regions. When considering unbalanced genomes, it is necessary to use insertions and deletions to transform one genome into another. In this thesis, we studied Rearrangement Distance problems on unbalanced genomes considering only gene order and their orientations (when they are known), as well as Intergenic Rearrangement Distance problems, which incorporate the information regarding the size distribution of intergenic regions, besides the use of gene order and their orientations (when they are known). We present new structures and concepts for problems that include reversals, transpositions, and the combination of reversals and transpositions. These structures and concepts are used in complexity proofs and approximation algorithms. Furthermore, we performed experiments in simulated and real genomes, showing the applicability of our algorithmsAbertoDoutoradoCiência da ComputaçãoDoutor em Ciência da ComputaçãoCNPQ202292/2020-7CAPES001[s.n.]Dias, Zanoni, 1975-Dias, Ulisses Martins, 1983-Walter, Maria Emília Machado TellesLee, OrlandoTelles, Guilherme PimentelUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASAlexandrino, Alexsandro Oliveira, 1995-20242024-03-27T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf1 recurso online (136 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/18489ALEXANDRINO, Alexsandro Oliveira. Variações do problema de distância de rearranjos. 2024. 1 recurso online (136 p.) Tese (doutorado) - Universidade Estadual de Campinas (UNICAMP), Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/18489. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1390745Cover: https://repositorio.unicamp.br/capa/capa?codigo=1390745porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2024-06-25T10:55:36Zoai::1390745Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2024-06-25T10:55:36Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Variações do problema de distância de rearranjos On variants of the genome rearrangement distance problem |
title |
Variações do problema de distância de rearranjos |
spellingShingle |
Variações do problema de distância de rearranjos Alexandrino, Alexsandro Oliveira, 1995- Rearranjo de genomas Biologia computacional Algoritmos de aproximação Ordenação (Computadores) Genome rearrangements Computational biology Approximation algorithms Sorting (Electronic computers) |
title_short |
Variações do problema de distância de rearranjos |
title_full |
Variações do problema de distância de rearranjos |
title_fullStr |
Variações do problema de distância de rearranjos |
title_full_unstemmed |
Variações do problema de distância de rearranjos |
title_sort |
Variações do problema de distância de rearranjos |
author |
Alexandrino, Alexsandro Oliveira, 1995- |
author_facet |
Alexandrino, Alexsandro Oliveira, 1995- |
author_role |
author |
dc.contributor.none.fl_str_mv |
Dias, Zanoni, 1975- Dias, Ulisses Martins, 1983- Walter, Maria Emília Machado Telles Lee, Orlando Telles, Guilherme Pimentel Universidade Estadual de Campinas (UNICAMP). Instituto de Computação Programa de Pós-Graduação em Ciência da Computação UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Alexandrino, Alexsandro Oliveira, 1995- |
dc.subject.por.fl_str_mv |
Rearranjo de genomas Biologia computacional Algoritmos de aproximação Ordenação (Computadores) Genome rearrangements Computational biology Approximation algorithms Sorting (Electronic computers) |
topic |
Rearranjo de genomas Biologia computacional Algoritmos de aproximação Ordenação (Computadores) Genome rearrangements Computational biology Approximation algorithms Sorting (Electronic computers) |
description |
Orientadores: Zanoni Dias, Ulisses Martins Dias |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024 2024-03-27T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/18489 ALEXANDRINO, Alexsandro Oliveira. Variações do problema de distância de rearranjos. 2024. 1 recurso online (136 p.) Tese (doutorado) - Universidade Estadual de Campinas (UNICAMP), Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/18489. Acesso em: 3 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/18489 |
identifier_str_mv |
ALEXANDRINO, Alexsandro Oliveira. Variações do problema de distância de rearranjos. 2024. 1 recurso online (136 p.) Tese (doutorado) - Universidade Estadual de Campinas (UNICAMP), Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/18489. Acesso em: 3 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/1390745 Cover: https://repositorio.unicamp.br/capa/capa?codigo=1390745 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 1 recurso online (136 p.) : il., digital, arquivo PDF. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189198900494336 |