Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica

Detalhes bibliográficos
Autor(a) principal: Oliveira, Lucas Peres, 1995-
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/7736
Resumo: Orientador: João Meidanis
id UNICAMP-30_3ddb000c7a1532ce987326675f8db614
oai_identifier_str oai::1260903
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômicaExtensões e aplicações da distância de posto genômicaRearranjo de genomasBioinformáticaGenômica comparativaMatrizesGenome rearrangementsBioinformaticsComparative genomicsMatricesOrientador: João MeidanisDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Sob uma perspectiva computacional, genomas podem ser modelados como uma coleção de segmentos orientados, comumente denominados blocos sintênicos, que representam regiões conservadas ao longo da evolução. Tais regiões são suscetíveis a mutações em larga escala --- conhecidas como rearranjos de genomas --- que permutam os blocos sintênicos em diferentes configurações. Ao longo dos anos, diversos modelos de distância baseados em rearranjos foram desenvolvidos a fim de calcular eficientemente a distância evolutiva entre genomas. Dentre eles, a distância de posto baseia-se na modelagem de genomas como matrizes e na utilização do posto como métrica de distância. A distância de posto é a sucessora da distância algébrica, um modelo de distância que representa genomas como permutações e é fundamentado na teoria de grupos de permutação. Recentemente, a distância de posto foi estendida para abarcar eventos de inserção e remoção --- indels. Embora existam algoritmos eficientes para calcular o posto nesse contexto, muitos resultados da teoria matricial para rearranjo de genomas ainda são fundamentados em noções de teoria de grupos de permutação. Em adição, os resultados são em grande parte teóricos, e pouco se conhece sobre a aplicabilidade biológica dessa extensão da distância de posto. Neste trabalho, consolidamos e expandimos os resultados recentes referentes à extensão da distância de posto que considera eventos de indel. Em particular, introduzimos uma estrutura de dados denominada grafo de colunas a fim de elaborar fórmulas mais simples para calcular o posto em tempo linear. Este ferramental permitiu que a teoria matricial para rearranjo de genomas e algoritmos derivados fossem simplificados consideravelmente. Em adição, realizamos experimentos em inferência filogenética utilizando dados simulados e genomas reais para averiguar a aplicabilidade biológica da distância de posto. Nossos resultados atestam que a distância de posto é competitiva quando comparada com a distância DCJ-Indel, um método estado-da-arte em rearranjo de genomas. Finalmente, apresentamos uma contribuição para o estudo de enumeração de cenários de ordenação sob a distância de postoAbstract: Under a computational perspective, genomes can be modelled as a collection of oriented segments, commonly known as synteny blocks, that represent conserved regions throughout evolution. Such regions are susceptible to large-scale mutations --- known as genome rearrangements --- that permute the synteny blocks in different configurations. Throughout the years, many rearrangement-based distance models were devised to calculate the evolutionary distance between genomes efficiently. Among them, the rank distance is based on modelling genomes as matrices and using the rank as a distance measure. The rank distance is the successor of the algebraic distance, a distance model that represents genomes as permutations and is grounded in the theory of permutation groups. Recently, the rank distance was extended to encompass insertion and deletion events --- indels. Although there exist algorithms to compute the rank efficiently in this context, many results in the matrix theory for genome rearrangements are still grounded in notions from the theory of permutation groups. In addition, the majority of the results are still theoretical, and little is known about the biological applicability of this extension of the rank distance. In this work, we consolidated and expanded the recent results regarding the extension of the rank distance that considers indel events. In particular, we introduce a data structure known as the column graph in order to devise simpler formulas to compute the rank in linear-time. This toolset allowed us to simplify the matrix theory for genome rearrangements and derived algorithms considerably. In addition, we performed experiments in phylogenetic inference using simulated data and real genomes to assess the biological applicability of the rank distance. Our results show that the rank distance is competitive when compared against the DCJ-Indel distance, a state-of-the-art method in genome rearrangements. Finally, we present a contribution to the study of enumeration of sorting scenarios under the rank distanMestradoCiência da ComputaçãoMestre em Ciência da ComputaçãoFAPESP2020/00740-8[s.n.]Meidanis, João, 1960-Martinez, Fábio Henrique ViduaniTelles, Guilherme PimentelUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASOliveira, Lucas Peres, 1995-20222022-12-05T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (68 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/7736OLIVEIRA, Lucas Peres. Extensions and applications of the genomic rank distance: Extensões e aplicações da distância de posto genômica. 2022. 1 recurso online (68 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7736. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1260903Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2023-03-07T11:31:29Zoai::1260903Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2023-03-07T11:31:29Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica
Extensões e aplicações da distância de posto genômica
title Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica
spellingShingle Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica
Oliveira, Lucas Peres, 1995-
Rearranjo de genomas
Bioinformática
Genômica comparativa
Matrizes
Genome rearrangements
Bioinformatics
Comparative genomics
Matrices
title_short Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica
title_full Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica
title_fullStr Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica
title_full_unstemmed Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica
title_sort Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica
author Oliveira, Lucas Peres, 1995-
author_facet Oliveira, Lucas Peres, 1995-
author_role author
dc.contributor.none.fl_str_mv Meidanis, João, 1960-
Martinez, Fábio Henrique Viduani
Telles, Guilherme Pimentel
Universidade Estadual de Campinas (UNICAMP). Instituto de Computação
Programa de Pós-Graduação em Ciência da Computação
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Oliveira, Lucas Peres, 1995-
dc.subject.por.fl_str_mv Rearranjo de genomas
Bioinformática
Genômica comparativa
Matrizes
Genome rearrangements
Bioinformatics
Comparative genomics
Matrices
topic Rearranjo de genomas
Bioinformática
Genômica comparativa
Matrizes
Genome rearrangements
Bioinformatics
Comparative genomics
Matrices
description Orientador: João Meidanis
publishDate 2022
dc.date.none.fl_str_mv 2022
2022-12-05T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/7736
OLIVEIRA, Lucas Peres. Extensions and applications of the genomic rank distance: Extensões e aplicações da distância de posto genômica. 2022. 1 recurso online (68 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7736. Acesso em: 3 set. 2024.
url https://hdl.handle.net/20.500.12733/7736
identifier_str_mv OLIVEIRA, Lucas Peres. Extensions and applications of the genomic rank distance: Extensões e aplicações da distância de posto genômica. 2022. 1 recurso online (68 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7736. Acesso em: 3 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1260903
Requisitos do sistema: Software para leitura de arquivo em PDF
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
1 recurso online (68 p.) : il., digital, arquivo PDF.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809189187385032704