Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/7736 |
Resumo: | Orientador: João Meidanis |
id |
UNICAMP-30_3ddb000c7a1532ce987326675f8db614 |
---|---|
oai_identifier_str |
oai::1260903 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômicaExtensões e aplicações da distância de posto genômicaRearranjo de genomasBioinformáticaGenômica comparativaMatrizesGenome rearrangementsBioinformaticsComparative genomicsMatricesOrientador: João MeidanisDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Sob uma perspectiva computacional, genomas podem ser modelados como uma coleção de segmentos orientados, comumente denominados blocos sintênicos, que representam regiões conservadas ao longo da evolução. Tais regiões são suscetíveis a mutações em larga escala --- conhecidas como rearranjos de genomas --- que permutam os blocos sintênicos em diferentes configurações. Ao longo dos anos, diversos modelos de distância baseados em rearranjos foram desenvolvidos a fim de calcular eficientemente a distância evolutiva entre genomas. Dentre eles, a distância de posto baseia-se na modelagem de genomas como matrizes e na utilização do posto como métrica de distância. A distância de posto é a sucessora da distância algébrica, um modelo de distância que representa genomas como permutações e é fundamentado na teoria de grupos de permutação. Recentemente, a distância de posto foi estendida para abarcar eventos de inserção e remoção --- indels. Embora existam algoritmos eficientes para calcular o posto nesse contexto, muitos resultados da teoria matricial para rearranjo de genomas ainda são fundamentados em noções de teoria de grupos de permutação. Em adição, os resultados são em grande parte teóricos, e pouco se conhece sobre a aplicabilidade biológica dessa extensão da distância de posto. Neste trabalho, consolidamos e expandimos os resultados recentes referentes à extensão da distância de posto que considera eventos de indel. Em particular, introduzimos uma estrutura de dados denominada grafo de colunas a fim de elaborar fórmulas mais simples para calcular o posto em tempo linear. Este ferramental permitiu que a teoria matricial para rearranjo de genomas e algoritmos derivados fossem simplificados consideravelmente. Em adição, realizamos experimentos em inferência filogenética utilizando dados simulados e genomas reais para averiguar a aplicabilidade biológica da distância de posto. Nossos resultados atestam que a distância de posto é competitiva quando comparada com a distância DCJ-Indel, um método estado-da-arte em rearranjo de genomas. Finalmente, apresentamos uma contribuição para o estudo de enumeração de cenários de ordenação sob a distância de postoAbstract: Under a computational perspective, genomes can be modelled as a collection of oriented segments, commonly known as synteny blocks, that represent conserved regions throughout evolution. Such regions are susceptible to large-scale mutations --- known as genome rearrangements --- that permute the synteny blocks in different configurations. Throughout the years, many rearrangement-based distance models were devised to calculate the evolutionary distance between genomes efficiently. Among them, the rank distance is based on modelling genomes as matrices and using the rank as a distance measure. The rank distance is the successor of the algebraic distance, a distance model that represents genomes as permutations and is grounded in the theory of permutation groups. Recently, the rank distance was extended to encompass insertion and deletion events --- indels. Although there exist algorithms to compute the rank efficiently in this context, many results in the matrix theory for genome rearrangements are still grounded in notions from the theory of permutation groups. In addition, the majority of the results are still theoretical, and little is known about the biological applicability of this extension of the rank distance. In this work, we consolidated and expanded the recent results regarding the extension of the rank distance that considers indel events. In particular, we introduce a data structure known as the column graph in order to devise simpler formulas to compute the rank in linear-time. This toolset allowed us to simplify the matrix theory for genome rearrangements and derived algorithms considerably. In addition, we performed experiments in phylogenetic inference using simulated data and real genomes to assess the biological applicability of the rank distance. Our results show that the rank distance is competitive when compared against the DCJ-Indel distance, a state-of-the-art method in genome rearrangements. Finally, we present a contribution to the study of enumeration of sorting scenarios under the rank distanMestradoCiência da ComputaçãoMestre em Ciência da ComputaçãoFAPESP2020/00740-8[s.n.]Meidanis, João, 1960-Martinez, Fábio Henrique ViduaniTelles, Guilherme PimentelUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASOliveira, Lucas Peres, 1995-20222022-12-05T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (68 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/7736OLIVEIRA, Lucas Peres. Extensions and applications of the genomic rank distance: Extensões e aplicações da distância de posto genômica. 2022. 1 recurso online (68 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7736. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1260903Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2023-03-07T11:31:29Zoai::1260903Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2023-03-07T11:31:29Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica Extensões e aplicações da distância de posto genômica |
title |
Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica |
spellingShingle |
Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica Oliveira, Lucas Peres, 1995- Rearranjo de genomas Bioinformática Genômica comparativa Matrizes Genome rearrangements Bioinformatics Comparative genomics Matrices |
title_short |
Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica |
title_full |
Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica |
title_fullStr |
Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica |
title_full_unstemmed |
Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica |
title_sort |
Extensions and applications of the genomic rank distance : Extensões e aplicações da distância de posto genômica |
author |
Oliveira, Lucas Peres, 1995- |
author_facet |
Oliveira, Lucas Peres, 1995- |
author_role |
author |
dc.contributor.none.fl_str_mv |
Meidanis, João, 1960- Martinez, Fábio Henrique Viduani Telles, Guilherme Pimentel Universidade Estadual de Campinas (UNICAMP). Instituto de Computação Programa de Pós-Graduação em Ciência da Computação UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Oliveira, Lucas Peres, 1995- |
dc.subject.por.fl_str_mv |
Rearranjo de genomas Bioinformática Genômica comparativa Matrizes Genome rearrangements Bioinformatics Comparative genomics Matrices |
topic |
Rearranjo de genomas Bioinformática Genômica comparativa Matrizes Genome rearrangements Bioinformatics Comparative genomics Matrices |
description |
Orientador: João Meidanis |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022 2022-12-05T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/7736 OLIVEIRA, Lucas Peres. Extensions and applications of the genomic rank distance: Extensões e aplicações da distância de posto genômica. 2022. 1 recurso online (68 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7736. Acesso em: 3 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/7736 |
identifier_str_mv |
OLIVEIRA, Lucas Peres. Extensions and applications of the genomic rank distance: Extensões e aplicações da distância de posto genômica. 2022. 1 recurso online (68 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7736. Acesso em: 3 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/1260903 Requisitos do sistema: Software para leitura de arquivo em PDF |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 1 recurso online (68 p.) : il., digital, arquivo PDF. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189187385032704 |