Modelos com proporção entre operações e regiões intergênicas rígidas e flexíveis

Detalhes bibliográficos
Autor(a) principal: Brito, Klairton de Lima, 1991-
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/7143
Resumo: Orientadores: Zanoni Dias, Ulisses Martins Dias
id UNICAMP-30_a7869dd47ce43e762fdd7f7a04b21b88
oai_identifier_str oai::1258784
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Modelos com proporção entre operações e regiões intergênicas rígidas e flexíveisModels with a proportion ratio between operations and rigid and flexible intergenic regionsBiologia computacionalRearranjo de genomasAlgoritmos de aproximaçãoTeoria da computaçãoComputational biologyGenome rearrangementsApproximation algorithmsTheory of computingOrientadores: Zanoni Dias, Ulisses Martins DiasTese (doutorado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: A genômica comparativa é um campo de pesquisa da biologia com foco na comparação de características genéticas entre organismos. Dentre as características genéticas comumente utilizadas, podemos citar a sequência de genes dos genomas. O número de mutações genéticas capazes de transformar uma sequência genética em outra é uma das métricas amplamente utilizada para a comparação de dois genomas. Os rearranjos de genoma são eventos mutacionais que podem afetar grandes trechos de um genoma. A reversão e a transposição são dois dos eventos de rearranjo mais estudados na literatura. Uma reversão inverte um segmento do genoma, enquanto uma transposição troca a posição de dois segmentos adjacentes. Um modelo de rearranjo determina o conjunto de eventos de rearranjo que podem ser utilizados para transformar um genoma em outro. Os primeiros estudos apresentaram resultados considerando modelos de rearranjo constituídos exclusivamente por um único tipo de evento de rearranjo. Estudos posteriores apresentaram resultados considerando modelos de rearranjo compostos por múltiplos tipos de eventos de rearranjo. Quando consideramos apenas o número de eventos de rearranjo necessários para transformar um genoma em outro, assumimos que cada evento tem a mesma probabilidade de ocorrer em um cenário evolutivo, sendo essa abordagem chamada de não ponderada. No entanto, quando assumimos que determinados tipos de eventos ocorrem mais do que outros, é possível atribuir um custo a cada tipo de evento de rearranjo. Nessa nova versão, o objetivo do problema consiste em buscar uma sequência de eventos de rearranjo que transforme um genoma em outro com custo mínimo, sendo essa abordagem chamada de ponderada. Nesta tese, apresentamos uma abordagem que considera uma proporção mínima entre a quantidade de eventos de reversão e o tamanho da sequência de eventos de rearranjo que transforma um genoma em outro. Nós mostramos que a abordagem de proporção naturalmente contorna problemas que podem surgir adotando uma abordagem ponderada ou não ponderada. Além disso, realizamos uma análise de complexidade do problema e apresentamos algoritmos de aproximação com fatores constantes. Estudos têm destacado a importância da informação presente nas regiões intergênicas, que são estruturas presentes entre cada par de genes e nas extremidades de um genoma, e que podem levar a modelos mais realistas considerando um contexto evolutivo. O tamanho de cada região intergênica é dado pelo número de nucleotídeos presentes nela. Desde então, foram apresentados estudos considerando tanto a sequência de genes quanto o tamanho das regiões intergênicas para representar um genoma. Nesta tese, mostramos resultados nesse mesmo contexto, mas consideramos diferentes modelos de rearranjo. Além disso, introduzimos uma generalização dos problemas possibilitando atribuir um grau de flexibilidade em relação ao tamanho das regiões intergênicas desejadas no genoma alvo. Para ambos os casos, realizamos uma análise de complexidade dos problemas, desenvolvemos algoritmos e conduzimos experimentos para verificar o desempenho práticoAbstract: Comparative genomics is a field of research in biology focusing on comparing genetic features between organisms. Among the genetic features commonly used, we can mention the sequence of genes in genomes. The number of genetic mutations capable of transforming one gene sequence into another is a widely used metric to compare genomes. Genome rearrangement events are mutational events that can affect large stretches of a genome. Reversal and transposition are two of the most studied rearrangement events in the literature. A reversal inverts a genome segment, while a transposition exchanges the position of two adjacent segments. A rearrangement model determines the set of rearrangement events that can be used to transform one genome into another. Early studies presented results considering a rearrangement model consisting exclusively of a single type of rearrangement event. However, subsequent studies presented results considering rearrangement models composed of multiple rearrangement events. When we consider only the number of rearrangement events that are required to transform one genome into another, we assume that each event has the same probability of occurring in an evolutionary scenario; this is called the unweighted approach. However, when we want certain types of events to occur more than others, it is possible to assign a cost to each type of rearrangement event. The problem goal changes to search for a sequence of rearrangement events that transforms one genome into another with minimal cost; this is called the weighted approach. In this work, we introduce an approach that considers a minimum proportion between the number of reversal events and the size of the rearrangement sequence that transforms one genome into another. We show that the proportion approach naturally overcomes problems that may arise by adopting a weighted or unweighted approach. In addition, we perform a complexity analysis of the problem and present approximation algorithms with constant factors. Another genetic feature that studies pointed out as relevant in a genetic comparison context is the intergenic regions, which are structures between each pair of genes and at the extremities of a genome. The size of each intergenic region is the number of nucleotides within it. Since then, studies were presented considering both the sequence of genes and the size of the intergenic regions to represent a genome. In this work, we show results in this same context but we consider different rearrangement models. In addition, we introduce a generalization of the problems such that it is possible to assign a degree of flexibility regarding the size of the intergenic regions desired in the target genome. For both cases, we conducted a complexity analysis of the problems, developed algorithms, and performed experiments to verify the practical performanceDoutoradoCiência da ComputaçãoDoutor em Ciência da ComputaçãoCNPQ140272/2020-8CAPES001[s.n.]Dias, Zanoni, 1975-Dias, Ulisses Martins, 1983-Lintzmayer, Carla NegriWalter, Maria Emília Machado TellesLee, OrlandoSchouery, Rafael Crivellari SalibaUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASBrito, Klairton de Lima, 1991-20222022-12-16T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf1 recurso online (208 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/7143BRITO, Klairton de Lima. Modelos com proporção entre operações e regiões intergênicas rígidas e flexíveis. 2022. 1 recurso online (208 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7143. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1258784porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2023-01-25T12:59:22Zoai::1258784Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2023-01-25T12:59:22Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Modelos com proporção entre operações e regiões intergênicas rígidas e flexíveis
Models with a proportion ratio between operations and rigid and flexible intergenic regions
title Modelos com proporção entre operações e regiões intergênicas rígidas e flexíveis
spellingShingle Modelos com proporção entre operações e regiões intergênicas rígidas e flexíveis
Brito, Klairton de Lima, 1991-
Biologia computacional
Rearranjo de genomas
Algoritmos de aproximação
Teoria da computação
Computational biology
Genome rearrangements
Approximation algorithms
Theory of computing
title_short Modelos com proporção entre operações e regiões intergênicas rígidas e flexíveis
title_full Modelos com proporção entre operações e regiões intergênicas rígidas e flexíveis
title_fullStr Modelos com proporção entre operações e regiões intergênicas rígidas e flexíveis
title_full_unstemmed Modelos com proporção entre operações e regiões intergênicas rígidas e flexíveis
title_sort Modelos com proporção entre operações e regiões intergênicas rígidas e flexíveis
author Brito, Klairton de Lima, 1991-
author_facet Brito, Klairton de Lima, 1991-
author_role author
dc.contributor.none.fl_str_mv Dias, Zanoni, 1975-
Dias, Ulisses Martins, 1983-
Lintzmayer, Carla Negri
Walter, Maria Emília Machado Telles
Lee, Orlando
Schouery, Rafael Crivellari Saliba
Universidade Estadual de Campinas (UNICAMP). Instituto de Computação
Programa de Pós-Graduação em Ciência da Computação
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Brito, Klairton de Lima, 1991-
dc.subject.por.fl_str_mv Biologia computacional
Rearranjo de genomas
Algoritmos de aproximação
Teoria da computação
Computational biology
Genome rearrangements
Approximation algorithms
Theory of computing
topic Biologia computacional
Rearranjo de genomas
Algoritmos de aproximação
Teoria da computação
Computational biology
Genome rearrangements
Approximation algorithms
Theory of computing
description Orientadores: Zanoni Dias, Ulisses Martins Dias
publishDate 2022
dc.date.none.fl_str_mv 2022
2022-12-16T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/7143
BRITO, Klairton de Lima. Modelos com proporção entre operações e regiões intergênicas rígidas e flexíveis. 2022. 1 recurso online (208 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7143. Acesso em: 3 set. 2024.
url https://hdl.handle.net/20.500.12733/7143
identifier_str_mv BRITO, Klairton de Lima. Modelos com proporção entre operações e regiões intergênicas rígidas e flexíveis. 2022. 1 recurso online (208 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7143. Acesso em: 3 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1258784
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
1 recurso online (208 p.) : il., digital, arquivo PDF.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809189186540929024