Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos

Detalhes bibliográficos
Autor(a) principal: Lima, Nicholas Costa Barroso
Data de Publicação: 2011
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações do LNCC
Texto Completo: https://tede.lncc.br/handle/tede/153
Resumo: Polimorfismos de Unico Nucleotídeo, SNP, são freqüentes e podem ser responsáveis por diferentes fenótipos. A atenção em torno deste tipo de polimorfismo se intensificou quando se descobriu, através do projeto de seqüenciamento do genoma humano, que eram responsáveis pela maior parte da variabilidade genética (90%) entre genomas humanos completos comparados. Com isso apresentando uma freqüência de ocorrência de 1 SNP em intervalos de 1.000-2.000pb. Recentemente vários estudos se concentraram na detecção desse tipo de polimorfismo em genomas bacterianos para uso em tipagem de estirpes e reconstrução de filogenia, por exemplo. Neste trabalho foi desenvolvida uma metodologia de detecção e filtragem de SNPs para genomas bacterianos visando a análise da prevalência desse tipo de polimorfismo. A metodologia envolve o uso de algoritmos de alinhamento de seqüência e filtros desenvolvidos na linguagem de programação PERL para a detecção e filtragem de SNPs com a finalidade de se obter um conjunto final confiável. A ocorrência de SNPs se encaixa no conceito de distribuição de probabilidade de Poisson por serem eventos que ocorrem em um intervalo, nesse caso, seqüência codificantes. Dentro deste contexto, também foi calculada a freqüência esperada de SNPs para cada caso estudado usando uma distribuição de probabilidade de Poisson. Microrganismos que apresentem SNPs em uma freqüência acima da esperada podem estar sujeitos a pressões seletivas diferenciadas. A metodologia foi testada e avaliada para genomas em cinco gêneros da família Enterobacteriaceae (Enterobacter, Escherichia, Salmonella, Shigella e Yersinia) e utilizada no caso específico da bactéria Klebsiella pneumoniae str. Kp13, causadora de infecção nosocomial isolada no Brasil. A metodologia se provou capaz de detectar e filtrar SNPs em diferentes espécies da família Enterobacteriaceae em concordância com dados já publicados. Para as 4 estirpes de Klebsiella pneumoniae foi observada a ocorrência desse tipo de polimorfismo entre as estirpes comparadas. Desta maneira, seqüências codificantes com um número de SNPs maior que a freqüência esperada, obtida com a Distribuição de Probabilidade de Poisson, foram investigadas para averiguação da sua possível associação com o estilo de vida bacteriano.
id LNCC_18c3cef2e3a83b316602146976e14aba
oai_identifier_str oai:tede-server.lncc.br:tede/153
network_acronym_str LNCC
network_name_str Biblioteca Digital de Teses e Dissertações do LNCC
repository_id_str
spelling Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianosCompuitational approach for detection and analysis of single-nucleotide polymorphisms SNPS)in bacterial genomesBioinformáticaBioinformaticsCNPQ::CIENCIAS BIOLOGICAS::GENETICAPolimorfismos de Unico Nucleotídeo, SNP, são freqüentes e podem ser responsáveis por diferentes fenótipos. A atenção em torno deste tipo de polimorfismo se intensificou quando se descobriu, através do projeto de seqüenciamento do genoma humano, que eram responsáveis pela maior parte da variabilidade genética (90%) entre genomas humanos completos comparados. Com isso apresentando uma freqüência de ocorrência de 1 SNP em intervalos de 1.000-2.000pb. Recentemente vários estudos se concentraram na detecção desse tipo de polimorfismo em genomas bacterianos para uso em tipagem de estirpes e reconstrução de filogenia, por exemplo. Neste trabalho foi desenvolvida uma metodologia de detecção e filtragem de SNPs para genomas bacterianos visando a análise da prevalência desse tipo de polimorfismo. A metodologia envolve o uso de algoritmos de alinhamento de seqüência e filtros desenvolvidos na linguagem de programação PERL para a detecção e filtragem de SNPs com a finalidade de se obter um conjunto final confiável. A ocorrência de SNPs se encaixa no conceito de distribuição de probabilidade de Poisson por serem eventos que ocorrem em um intervalo, nesse caso, seqüência codificantes. Dentro deste contexto, também foi calculada a freqüência esperada de SNPs para cada caso estudado usando uma distribuição de probabilidade de Poisson. Microrganismos que apresentem SNPs em uma freqüência acima da esperada podem estar sujeitos a pressões seletivas diferenciadas. A metodologia foi testada e avaliada para genomas em cinco gêneros da família Enterobacteriaceae (Enterobacter, Escherichia, Salmonella, Shigella e Yersinia) e utilizada no caso específico da bactéria Klebsiella pneumoniae str. Kp13, causadora de infecção nosocomial isolada no Brasil. A metodologia se provou capaz de detectar e filtrar SNPs em diferentes espécies da família Enterobacteriaceae em concordância com dados já publicados. Para as 4 estirpes de Klebsiella pneumoniae foi observada a ocorrência desse tipo de polimorfismo entre as estirpes comparadas. Desta maneira, seqüências codificantes com um número de SNPs maior que a freqüência esperada, obtida com a Distribuição de Probabilidade de Poisson, foram investigadas para averiguação da sua possível associação com o estilo de vida bacteriano.Single nucleotide polymorphism, SNP, are common and may be responsible for di_erent phenotypes. The attention around this type of polymorphism was intensi_ed when it was discovered, through the sequencing project of the human genome, that they were responsible for most of the genetic variability (90%) of complete human genomes compared. Thus, presenting a frequency of occurrence of one SNP per 1.000-2.000bp intervals. Recently, several studies have focused on the detection of this type of polymorphism in bacterial genomes for use in bacterial strain typing and phylogeny reconstruction, for example. In this work we developed a methodology for detecting and _ltering SNPs for bacterial genomes in order to analyze the prevalence of this type of polymorphism. The methodology involves the use of sequence alignment algorithms and _lters developed in PERL programming language for the detection and filtering of SNPs in order to obtain a reliable final set. The occurrence of SNPs fits the concept of Poisson probability distribution because they are events that occur in an interval, in this case, coding sequences. Within this context, we also calculated the expected frequency of SNPs for each case using a Poisson probability distribution. SNPs that exceeded the expected frequency may be subject to diferent selective pressure. The methodology was tested and evaluated for genomes in five genera of the family Enterobacteriaceae (Enterobacter, Escherichia, Salmonella, Shigella and Yersinia) and used in the case study of Klebsiella pneumoniae str. Kp13 genome, a bacteria causing nosocomial infection. The methodology has been able to detect and filter SNPs in diferent species of the family Enterobacteriaceae in accordance with data already published. For the four Klebsiella pneumoniae strains analyzed the occurrence of such polymorphism between the strains compared was observed. Thus, coding sequences with a number of SNPs higher than the expected frequency, obtained by the Poisson Probability Distribution, have been investigated to assess its possible association with the bacteria lifestyle.Laboratório Nacional de Computação CientíficaServiço de Análise e Apoio a Formação de Recursos HumanosBrLNCCPrograma de Pós-Graduação em Modelagem ComputacionalNicolás, Marisa FabianaCantão, Mauricio EgidioCPF:21257053892CPF:28596039805http://lattes.cnpq.br/0717161560405537http://lattes.cnpq.br/6154630512714298Porto, Fabio Andre MachadoCPF:88404595704http://lattes.cnpq.br/6418711808050575Picão, Renata CristinaCPF:30292767838http://lattes.cnpq.br/3656759928090726Lima, Nicholas Costa Barroso2015-03-04T18:57:46Z2013-07-082011-12-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://tede.lncc.br/handle/tede/153porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCC2018-07-04T12:59:42Zoai:tede-server.lncc.br:tede/153Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2018-07-04T12:59:42Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false
dc.title.none.fl_str_mv Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
Compuitational approach for detection and analysis of single-nucleotide polymorphisms SNPS)in bacterial genomes
title Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
spellingShingle Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
Lima, Nicholas Costa Barroso
Bioinformática
Bioinformatics
CNPQ::CIENCIAS BIOLOGICAS::GENETICA
title_short Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
title_full Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
title_fullStr Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
title_full_unstemmed Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
title_sort Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
author Lima, Nicholas Costa Barroso
author_facet Lima, Nicholas Costa Barroso
author_role author
dc.contributor.none.fl_str_mv Nicolás, Marisa Fabiana
Cantão, Mauricio Egidio
CPF:21257053892
CPF:28596039805
http://lattes.cnpq.br/0717161560405537
http://lattes.cnpq.br/6154630512714298
Porto, Fabio Andre Machado
CPF:88404595704
http://lattes.cnpq.br/6418711808050575
Picão, Renata Cristina
CPF:30292767838
http://lattes.cnpq.br/3656759928090726
dc.contributor.author.fl_str_mv Lima, Nicholas Costa Barroso
dc.subject.por.fl_str_mv Bioinformática
Bioinformatics
CNPQ::CIENCIAS BIOLOGICAS::GENETICA
topic Bioinformática
Bioinformatics
CNPQ::CIENCIAS BIOLOGICAS::GENETICA
description Polimorfismos de Unico Nucleotídeo, SNP, são freqüentes e podem ser responsáveis por diferentes fenótipos. A atenção em torno deste tipo de polimorfismo se intensificou quando se descobriu, através do projeto de seqüenciamento do genoma humano, que eram responsáveis pela maior parte da variabilidade genética (90%) entre genomas humanos completos comparados. Com isso apresentando uma freqüência de ocorrência de 1 SNP em intervalos de 1.000-2.000pb. Recentemente vários estudos se concentraram na detecção desse tipo de polimorfismo em genomas bacterianos para uso em tipagem de estirpes e reconstrução de filogenia, por exemplo. Neste trabalho foi desenvolvida uma metodologia de detecção e filtragem de SNPs para genomas bacterianos visando a análise da prevalência desse tipo de polimorfismo. A metodologia envolve o uso de algoritmos de alinhamento de seqüência e filtros desenvolvidos na linguagem de programação PERL para a detecção e filtragem de SNPs com a finalidade de se obter um conjunto final confiável. A ocorrência de SNPs se encaixa no conceito de distribuição de probabilidade de Poisson por serem eventos que ocorrem em um intervalo, nesse caso, seqüência codificantes. Dentro deste contexto, também foi calculada a freqüência esperada de SNPs para cada caso estudado usando uma distribuição de probabilidade de Poisson. Microrganismos que apresentem SNPs em uma freqüência acima da esperada podem estar sujeitos a pressões seletivas diferenciadas. A metodologia foi testada e avaliada para genomas em cinco gêneros da família Enterobacteriaceae (Enterobacter, Escherichia, Salmonella, Shigella e Yersinia) e utilizada no caso específico da bactéria Klebsiella pneumoniae str. Kp13, causadora de infecção nosocomial isolada no Brasil. A metodologia se provou capaz de detectar e filtrar SNPs em diferentes espécies da família Enterobacteriaceae em concordância com dados já publicados. Para as 4 estirpes de Klebsiella pneumoniae foi observada a ocorrência desse tipo de polimorfismo entre as estirpes comparadas. Desta maneira, seqüências codificantes com um número de SNPs maior que a freqüência esperada, obtida com a Distribuição de Probabilidade de Poisson, foram investigadas para averiguação da sua possível associação com o estilo de vida bacteriano.
publishDate 2011
dc.date.none.fl_str_mv 2011-12-01
2013-07-08
2015-03-04T18:57:46Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://tede.lncc.br/handle/tede/153
url https://tede.lncc.br/handle/tede/153
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
Serviço de Análise e Apoio a Formação de Recursos Humanos
Br
LNCC
Programa de Pós-Graduação em Modelagem Computacional
publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
Serviço de Análise e Apoio a Formação de Recursos Humanos
Br
LNCC
Programa de Pós-Graduação em Modelagem Computacional
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do LNCC
instname:Laboratório Nacional de Computação Científica (LNCC)
instacron:LNCC
instname_str Laboratório Nacional de Computação Científica (LNCC)
instacron_str LNCC
institution LNCC
reponame_str Biblioteca Digital de Teses e Dissertações do LNCC
collection Biblioteca Digital de Teses e Dissertações do LNCC
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)
repository.mail.fl_str_mv library@lncc.br||library@lncc.br
_version_ 1816081206068903936