Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos

Detalhes bibliográficos
Autor(a) principal: Lima, Nicholas Costa Barroso
Data de Publicação: 2011
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações do LNCC
Texto Completo: https://tede.lncc.br/handle/tede/153
Resumo: Single nucleotide polymorphism, SNP, are common and may be responsible for di_erent phenotypes. The attention around this type of polymorphism was intensi_ed when it was discovered, through the sequencing project of the human genome, that they were responsible for most of the genetic variability (90%) of complete human genomes compared. Thus, presenting a frequency of occurrence of one SNP per 1.000-2.000bp intervals. Recently, several studies have focused on the detection of this type of polymorphism in bacterial genomes for use in bacterial strain typing and phylogeny reconstruction, for example. In this work we developed a methodology for detecting and _ltering SNPs for bacterial genomes in order to analyze the prevalence of this type of polymorphism. The methodology involves the use of sequence alignment algorithms and _lters developed in PERL programming language for the detection and filtering of SNPs in order to obtain a reliable final set. The occurrence of SNPs fits the concept of Poisson probability distribution because they are events that occur in an interval, in this case, coding sequences. Within this context, we also calculated the expected frequency of SNPs for each case using a Poisson probability distribution. SNPs that exceeded the expected frequency may be subject to diferent selective pressure. The methodology was tested and evaluated for genomes in five genera of the family Enterobacteriaceae (Enterobacter, Escherichia, Salmonella, Shigella and Yersinia) and used in the case study of Klebsiella pneumoniae str. Kp13 genome, a bacteria causing nosocomial infection. The methodology has been able to detect and filter SNPs in diferent species of the family Enterobacteriaceae in accordance with data already published. For the four Klebsiella pneumoniae strains analyzed the occurrence of such polymorphism between the strains compared was observed. Thus, coding sequences with a number of SNPs higher than the expected frequency, obtained by the Poisson Probability Distribution, have been investigated to assess its possible association with the bacteria lifestyle.
id LNCC_18c3cef2e3a83b316602146976e14aba
oai_identifier_str oai:tede-server.lncc.br:tede/153
network_acronym_str LNCC
network_name_str Biblioteca Digital de Teses e Dissertações do LNCC
repository_id_str
spelling Nicolás, Marisa FabianaCantão, Mauricio EgidioCPF:21257053892CPF:28596039805http://lattes.cnpq.br/0717161560405537http://lattes.cnpq.br/6154630512714298Porto, Fabio Andre MachadoCPF:88404595704http://lattes.cnpq.br/6418711808050575Picão, Renata CristinaCPF:30292767838http://lattes.cnpq.br/3656759928090726CPF:02450803335http://lattes.cnpq.br/4562242525067066Lima, Nicholas Costa Barroso2015-03-04T18:57:46Z2013-07-082011-12-01https://tede.lncc.br/handle/tede/153Single nucleotide polymorphism, SNP, are common and may be responsible for di_erent phenotypes. The attention around this type of polymorphism was intensi_ed when it was discovered, through the sequencing project of the human genome, that they were responsible for most of the genetic variability (90%) of complete human genomes compared. Thus, presenting a frequency of occurrence of one SNP per 1.000-2.000bp intervals. Recently, several studies have focused on the detection of this type of polymorphism in bacterial genomes for use in bacterial strain typing and phylogeny reconstruction, for example. In this work we developed a methodology for detecting and _ltering SNPs for bacterial genomes in order to analyze the prevalence of this type of polymorphism. The methodology involves the use of sequence alignment algorithms and _lters developed in PERL programming language for the detection and filtering of SNPs in order to obtain a reliable final set. The occurrence of SNPs fits the concept of Poisson probability distribution because they are events that occur in an interval, in this case, coding sequences. Within this context, we also calculated the expected frequency of SNPs for each case using a Poisson probability distribution. SNPs that exceeded the expected frequency may be subject to diferent selective pressure. The methodology was tested and evaluated for genomes in five genera of the family Enterobacteriaceae (Enterobacter, Escherichia, Salmonella, Shigella and Yersinia) and used in the case study of Klebsiella pneumoniae str. Kp13 genome, a bacteria causing nosocomial infection. The methodology has been able to detect and filter SNPs in diferent species of the family Enterobacteriaceae in accordance with data already published. For the four Klebsiella pneumoniae strains analyzed the occurrence of such polymorphism between the strains compared was observed. Thus, coding sequences with a number of SNPs higher than the expected frequency, obtained by the Poisson Probability Distribution, have been investigated to assess its possible association with the bacteria lifestyle.Polimorfismos de Unico Nucleotídeo, SNP, são freqüentes e podem ser responsáveis por diferentes fenótipos. A atenção em torno deste tipo de polimorfismo se intensificou quando se descobriu, através do projeto de seqüenciamento do genoma humano, que eram responsáveis pela maior parte da variabilidade genética (90%) entre genomas humanos completos comparados. Com isso apresentando uma freqüência de ocorrência de 1 SNP em intervalos de 1.000-2.000pb. Recentemente vários estudos se concentraram na detecção desse tipo de polimorfismo em genomas bacterianos para uso em tipagem de estirpes e reconstrução de filogenia, por exemplo. Neste trabalho foi desenvolvida uma metodologia de detecção e filtragem de SNPs para genomas bacterianos visando a análise da prevalência desse tipo de polimorfismo. A metodologia envolve o uso de algoritmos de alinhamento de seqüência e filtros desenvolvidos na linguagem de programação PERL para a detecção e filtragem de SNPs com a finalidade de se obter um conjunto final confiável. A ocorrência de SNPs se encaixa no conceito de distribuição de probabilidade de Poisson por serem eventos que ocorrem em um intervalo, nesse caso, seqüência codificantes. Dentro deste contexto, também foi calculada a freqüência esperada de SNPs para cada caso estudado usando uma distribuição de probabilidade de Poisson. Microrganismos que apresentem SNPs em uma freqüência acima da esperada podem estar sujeitos a pressões seletivas diferenciadas. A metodologia foi testada e avaliada para genomas em cinco gêneros da família Enterobacteriaceae (Enterobacter, Escherichia, Salmonella, Shigella e Yersinia) e utilizada no caso específico da bactéria Klebsiella pneumoniae str. Kp13, causadora de infecção nosocomial isolada no Brasil. A metodologia se provou capaz de detectar e filtrar SNPs em diferentes espécies da família Enterobacteriaceae em concordância com dados já publicados. Para as 4 estirpes de Klebsiella pneumoniae foi observada a ocorrência desse tipo de polimorfismo entre as estirpes comparadas. Desta maneira, seqüências codificantes com um número de SNPs maior que a freqüência esperada, obtida com a Distribuição de Probabilidade de Poisson, foram investigadas para averiguação da sua possível associação com o estilo de vida bacteriano.Made available in DSpace on 2015-03-04T18:57:46Z (GMT). No. of bitstreams: 1 NickDisser.pdf: 4259889 bytes, checksum: ee955de15c6345917110d7b6dc4b9765 (MD5) Previous issue date: 2011-12-01application/pdfhttp://tede-server.lncc.br:8080/retrieve/449/NickDisser.pdf.jpghttp://tede-server.lncc.br:8080/retrieve/660/NickDisser.pdf.jpgporLaboratório Nacional de Computação CientíficaPrograma de Pós-Graduação em Modelagem ComputacionalLNCCBrServiço de Análise e Apoio a Formação de Recursos HumanosBioinformáticaBioinformaticsCNPQ::CIENCIAS BIOLOGICAS::GENETICAAbordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianosCompuitational approach for detection and analysis of single-nucleotide polymorphisms SNPS)in bacterial genomesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCCORIGINALNickDisser.pdfapplication/pdf4259889http://tede-server.lncc.br:8080/tede/bitstream/tede/153/1/NickDisser.pdfee955de15c6345917110d7b6dc4b9765MD51TEXTNickDisser.pdf.txtNickDisser.pdf.txttext/plain255515http://tede-server.lncc.br:8080/tede/bitstream/tede/153/4/NickDisser.pdf.txtdce81785d9761e47967b05998a9f6640MD54THUMBNAILNickDisser.pdf.jpgNickDisser.pdf.jpgimage/jpeg3246http://tede-server.lncc.br:8080/tede/bitstream/tede/153/5/NickDisser.pdf.jpg539c29f10487eaaef4deae71eae550e4MD55tede/1532018-07-04 09:59:42.607oai:tede-server.lncc.br:tede/153Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2018-07-04T12:59:42Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false
dc.title.por.fl_str_mv Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
dc.title.alternative.eng.fl_str_mv Compuitational approach for detection and analysis of single-nucleotide polymorphisms SNPS)in bacterial genomes
title Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
spellingShingle Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
Lima, Nicholas Costa Barroso
Bioinformática
Bioinformatics
CNPQ::CIENCIAS BIOLOGICAS::GENETICA
title_short Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
title_full Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
title_fullStr Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
title_full_unstemmed Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
title_sort Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
author Lima, Nicholas Costa Barroso
author_facet Lima, Nicholas Costa Barroso
author_role author
dc.contributor.advisor1.fl_str_mv Nicolás, Marisa Fabiana
Cantão, Mauricio Egidio
dc.contributor.advisor1ID.fl_str_mv CPF:21257053892
CPF:28596039805
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/0717161560405537
http://lattes.cnpq.br/6154630512714298
dc.contributor.referee1.fl_str_mv Porto, Fabio Andre Machado
dc.contributor.referee1ID.fl_str_mv CPF:88404595704
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/6418711808050575
dc.contributor.referee2.fl_str_mv Picão, Renata Cristina
dc.contributor.referee2ID.fl_str_mv CPF:30292767838
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/3656759928090726
dc.contributor.authorID.fl_str_mv CPF:02450803335
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4562242525067066
dc.contributor.author.fl_str_mv Lima, Nicholas Costa Barroso
contributor_str_mv Nicolás, Marisa Fabiana
Cantão, Mauricio Egidio
Porto, Fabio Andre Machado
Picão, Renata Cristina
dc.subject.por.fl_str_mv Bioinformática
topic Bioinformática
Bioinformatics
CNPQ::CIENCIAS BIOLOGICAS::GENETICA
dc.subject.eng.fl_str_mv Bioinformatics
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS BIOLOGICAS::GENETICA
description Single nucleotide polymorphism, SNP, are common and may be responsible for di_erent phenotypes. The attention around this type of polymorphism was intensi_ed when it was discovered, through the sequencing project of the human genome, that they were responsible for most of the genetic variability (90%) of complete human genomes compared. Thus, presenting a frequency of occurrence of one SNP per 1.000-2.000bp intervals. Recently, several studies have focused on the detection of this type of polymorphism in bacterial genomes for use in bacterial strain typing and phylogeny reconstruction, for example. In this work we developed a methodology for detecting and _ltering SNPs for bacterial genomes in order to analyze the prevalence of this type of polymorphism. The methodology involves the use of sequence alignment algorithms and _lters developed in PERL programming language for the detection and filtering of SNPs in order to obtain a reliable final set. The occurrence of SNPs fits the concept of Poisson probability distribution because they are events that occur in an interval, in this case, coding sequences. Within this context, we also calculated the expected frequency of SNPs for each case using a Poisson probability distribution. SNPs that exceeded the expected frequency may be subject to diferent selective pressure. The methodology was tested and evaluated for genomes in five genera of the family Enterobacteriaceae (Enterobacter, Escherichia, Salmonella, Shigella and Yersinia) and used in the case study of Klebsiella pneumoniae str. Kp13 genome, a bacteria causing nosocomial infection. The methodology has been able to detect and filter SNPs in diferent species of the family Enterobacteriaceae in accordance with data already published. For the four Klebsiella pneumoniae strains analyzed the occurrence of such polymorphism between the strains compared was observed. Thus, coding sequences with a number of SNPs higher than the expected frequency, obtained by the Poisson Probability Distribution, have been investigated to assess its possible association with the bacteria lifestyle.
publishDate 2011
dc.date.issued.fl_str_mv 2011-12-01
dc.date.available.fl_str_mv 2013-07-08
dc.date.accessioned.fl_str_mv 2015-03-04T18:57:46Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://tede.lncc.br/handle/tede/153
url https://tede.lncc.br/handle/tede/153
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Modelagem Computacional
dc.publisher.initials.fl_str_mv LNCC
dc.publisher.country.fl_str_mv Br
dc.publisher.department.fl_str_mv Serviço de Análise e Apoio a Formação de Recursos Humanos
publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do LNCC
instname:Laboratório Nacional de Computação Científica (LNCC)
instacron:LNCC
instname_str Laboratório Nacional de Computação Científica (LNCC)
instacron_str LNCC
institution LNCC
reponame_str Biblioteca Digital de Teses e Dissertações do LNCC
collection Biblioteca Digital de Teses e Dissertações do LNCC
bitstream.url.fl_str_mv http://tede-server.lncc.br:8080/tede/bitstream/tede/153/1/NickDisser.pdf
http://tede-server.lncc.br:8080/tede/bitstream/tede/153/4/NickDisser.pdf.txt
http://tede-server.lncc.br:8080/tede/bitstream/tede/153/5/NickDisser.pdf.jpg
bitstream.checksum.fl_str_mv ee955de15c6345917110d7b6dc4b9765
dce81785d9761e47967b05998a9f6640
539c29f10487eaaef4deae71eae550e4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)
repository.mail.fl_str_mv library@lncc.br||library@lncc.br
_version_ 1791085990092210176