Construção de filogenias baseadas em genomas completos

Detalhes bibliográficos
Autor(a) principal: Oliveira, Karina Zupo de
Data de Publicação: 2010
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1612740
Resumo: Orientador: João Meidanis
id UNICAMP-30_1248208a54f7f8101833624d302ad151
oai_identifier_str oai::772832
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Construção de filogenias baseadas em genomas completosPhylogenies construction based on whole genomesBiologia computacionalFilogenia - Processamento de dadosGenomasHomologia (Biologia)VibriãoComputational biologyPhylogeny - Data processingGenomesVibrioOrientador: João MeidanisDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Contexto: A classificação de espécies começou sendo determinada pelas características fenotípicas dos organismos. Logo que o DNA foi descoberto, o sistema de classificação passou também a utilizar-se das características genotípicas. Ao longo dos últimos anos, avanços científicos permitiram que fossem sequenciados genomas completos. A cada ano, o número de genomas completamente sequenciados aumenta, e, com isso, é cada vez maior o número de trabalhos que tentam utilizar-se do maior número possível de genes para comparar dois ou mais organismos com o objetivo de melhor entender o relacionamento entre as diversas espécies. Experimento: Este trabalho executa comparações de pares de cromossomos de um grupo de 10 genomas completos da família Vibrionaceae e um genoma completo da bactéria Escherichia coli como externo ao grupo. As homologias entre as proteínas são determinadas através da base de famílias Protein Clusters (NCBI). A seguir, arvores ultramétricas e a classificação COG das proteínas são utilizadas para resolver as paralogias correspondentes. Após isto, as proteínas únicas, que representam os eventos de perda e ganho de genes, são eliminadas, de forma a igualar o conteúdo dos cromossomos. Tipicamente, 50% das proteínas originais do pares de organismos de mesma família 'sobrevivem" para serem utilizadas no cálculo da distância de rearranjo. Menos proteínas sobrevivem nas comparações com a bactéria externa ao grupo. A distância total é calculada pela soma do número de proteínas eliminadas e da distância de ordenação, medida através da distância de rearranjo dos cromossomos. Resultados: As comparações produziram matrizes de distâncias utilizadas para inferir árvores filogenéticas através do algoritmo Neighbor-Joining (NJ). As árvores filogenéticas encontradas mostraram-se congruentes em topologia com a árvore produzida pelo gene 16S rRNA. Isto mostra que a comparação de genomas completos é uma proposta sensata. Os desafios agora são aperfeiçoar os detalhes. O material suplementar (Apêndice A) contém uma implementação computacional dos experimentosAbstract: Context: Species classification was originally determined by phenotypic characteristics. With the advent of DNA sequencing, the classification system started using genotypes as well. Over the last decades, scientific progress allowed complete sequencing of genomes. Each year, the number of genomes completely sequenced increases, and with it, the number of works trying to use as much genes as possible to compare two or more organisms, in order to get a better understand of the relationship between several species. Experiment: This work executes a pairwise chromosome comparison from a set of 10 complete genomes from the Vibrionaceae family and one complete Escherichia coli genome as an outgroup. In our experiment, the homologies between proteins are assessed using the Protein Clusters (NCBI) database. In the next step, paralogies are resolved using ultrametric trees and COG classification. In the sequel, the loss and gain events are treated, thus, proteins present in only one chromosome from the pair are eliminated, in order to equalize the set of families in both chromosomes. Typically, 50% of the original proteins survive in comparisons between organisms of the same family (comparisons with the outgroup yield less survivors). The total distance is calculated by adding the number of eliminated proteins with the order distance, which is measured by the rearrangement distance beetween the chromosomes. Results: Genome comparison produces distance matrices used to infer the phylogenetic trees through the Neighbor-Joining (NJ) algorithm. The phylogenetic trees generated are congruent regarding the topology with the tree inferred using the 16S rRNA gene. Also, in order to run a deeper investigation, the experiment was executed with some variations such as not resolving the paralogies using ultrametric trees or only classifying proteins using COG database. Supplemental material (Appendix A) contains the experiment computational implementationMestradoBiologia ComputaçionalMestre em Ciência da Computação[s.n.]Meidanis, João, 1960-Thompson, Fabiano LopesDias, ZanoniUniversidade Estadual de Campinas. Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASOliveira, Karina Zupo de20102010-05-03T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf87 f. : il.https://hdl.handle.net/20.500.12733/1612740OLIVEIRA, Karina Zupo de. Construção de filogenias baseadas em genomas completos. 2010. 87 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1612740. Acesso em: 15 mai. 2024.https://repositorio.unicamp.br/acervo/detalhe/772832porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T05:57:40Zoai::772832Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T05:57:40Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Construção de filogenias baseadas em genomas completos
Phylogenies construction based on whole genomes
title Construção de filogenias baseadas em genomas completos
spellingShingle Construção de filogenias baseadas em genomas completos
Oliveira, Karina Zupo de
Biologia computacional
Filogenia - Processamento de dados
Genomas
Homologia (Biologia)
Vibrião
Computational biology
Phylogeny - Data processing
Genomes
Vibrio
title_short Construção de filogenias baseadas em genomas completos
title_full Construção de filogenias baseadas em genomas completos
title_fullStr Construção de filogenias baseadas em genomas completos
title_full_unstemmed Construção de filogenias baseadas em genomas completos
title_sort Construção de filogenias baseadas em genomas completos
author Oliveira, Karina Zupo de
author_facet Oliveira, Karina Zupo de
author_role author
dc.contributor.none.fl_str_mv Meidanis, João, 1960-
Thompson, Fabiano Lopes
Dias, Zanoni
Universidade Estadual de Campinas. Instituto de Computação
Programa de Pós-Graduação em Ciência da Computação
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Oliveira, Karina Zupo de
dc.subject.por.fl_str_mv Biologia computacional
Filogenia - Processamento de dados
Genomas
Homologia (Biologia)
Vibrião
Computational biology
Phylogeny - Data processing
Genomes
Vibrio
topic Biologia computacional
Filogenia - Processamento de dados
Genomas
Homologia (Biologia)
Vibrião
Computational biology
Phylogeny - Data processing
Genomes
Vibrio
description Orientador: João Meidanis
publishDate 2010
dc.date.none.fl_str_mv 2010
2010-05-03T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1612740
OLIVEIRA, Karina Zupo de. Construção de filogenias baseadas em genomas completos. 2010. 87 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1612740. Acesso em: 15 mai. 2024.
url https://hdl.handle.net/20.500.12733/1612740
identifier_str_mv OLIVEIRA, Karina Zupo de. Construção de filogenias baseadas em genomas completos. 2010. 87 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1612740. Acesso em: 15 mai. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/772832
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
87 f. : il.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1799138472031682560