Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2011 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações do LNCC |
Texto Completo: | https://tede.lncc.br/handle/tede/153 |
Resumo: | Polimorfismos de Unico Nucleotídeo, SNP, são freqüentes e podem ser responsáveis por diferentes fenótipos. A atenção em torno deste tipo de polimorfismo se intensificou quando se descobriu, através do projeto de seqüenciamento do genoma humano, que eram responsáveis pela maior parte da variabilidade genética (90%) entre genomas humanos completos comparados. Com isso apresentando uma freqüência de ocorrência de 1 SNP em intervalos de 1.000-2.000pb. Recentemente vários estudos se concentraram na detecção desse tipo de polimorfismo em genomas bacterianos para uso em tipagem de estirpes e reconstrução de filogenia, por exemplo. Neste trabalho foi desenvolvida uma metodologia de detecção e filtragem de SNPs para genomas bacterianos visando a análise da prevalência desse tipo de polimorfismo. A metodologia envolve o uso de algoritmos de alinhamento de seqüência e filtros desenvolvidos na linguagem de programação PERL para a detecção e filtragem de SNPs com a finalidade de se obter um conjunto final confiável. A ocorrência de SNPs se encaixa no conceito de distribuição de probabilidade de Poisson por serem eventos que ocorrem em um intervalo, nesse caso, seqüência codificantes. Dentro deste contexto, também foi calculada a freqüência esperada de SNPs para cada caso estudado usando uma distribuição de probabilidade de Poisson. Microrganismos que apresentem SNPs em uma freqüência acima da esperada podem estar sujeitos a pressões seletivas diferenciadas. A metodologia foi testada e avaliada para genomas em cinco gêneros da família Enterobacteriaceae (Enterobacter, Escherichia, Salmonella, Shigella e Yersinia) e utilizada no caso específico da bactéria Klebsiella pneumoniae str. Kp13, causadora de infecção nosocomial isolada no Brasil. A metodologia se provou capaz de detectar e filtrar SNPs em diferentes espécies da família Enterobacteriaceae em concordância com dados já publicados. Para as 4 estirpes de Klebsiella pneumoniae foi observada a ocorrência desse tipo de polimorfismo entre as estirpes comparadas. Desta maneira, seqüências codificantes com um número de SNPs maior que a freqüência esperada, obtida com a Distribuição de Probabilidade de Poisson, foram investigadas para averiguação da sua possível associação com o estilo de vida bacteriano. |
id |
LNCC_18c3cef2e3a83b316602146976e14aba |
---|---|
oai_identifier_str |
oai:tede-server.lncc.br:tede/153 |
network_acronym_str |
LNCC |
network_name_str |
Biblioteca Digital de Teses e Dissertações do LNCC |
repository_id_str |
|
spelling |
Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianosCompuitational approach for detection and analysis of single-nucleotide polymorphisms SNPS)in bacterial genomesBioinformáticaBioinformaticsCNPQ::CIENCIAS BIOLOGICAS::GENETICAPolimorfismos de Unico Nucleotídeo, SNP, são freqüentes e podem ser responsáveis por diferentes fenótipos. A atenção em torno deste tipo de polimorfismo se intensificou quando se descobriu, através do projeto de seqüenciamento do genoma humano, que eram responsáveis pela maior parte da variabilidade genética (90%) entre genomas humanos completos comparados. Com isso apresentando uma freqüência de ocorrência de 1 SNP em intervalos de 1.000-2.000pb. Recentemente vários estudos se concentraram na detecção desse tipo de polimorfismo em genomas bacterianos para uso em tipagem de estirpes e reconstrução de filogenia, por exemplo. Neste trabalho foi desenvolvida uma metodologia de detecção e filtragem de SNPs para genomas bacterianos visando a análise da prevalência desse tipo de polimorfismo. A metodologia envolve o uso de algoritmos de alinhamento de seqüência e filtros desenvolvidos na linguagem de programação PERL para a detecção e filtragem de SNPs com a finalidade de se obter um conjunto final confiável. A ocorrência de SNPs se encaixa no conceito de distribuição de probabilidade de Poisson por serem eventos que ocorrem em um intervalo, nesse caso, seqüência codificantes. Dentro deste contexto, também foi calculada a freqüência esperada de SNPs para cada caso estudado usando uma distribuição de probabilidade de Poisson. Microrganismos que apresentem SNPs em uma freqüência acima da esperada podem estar sujeitos a pressões seletivas diferenciadas. A metodologia foi testada e avaliada para genomas em cinco gêneros da família Enterobacteriaceae (Enterobacter, Escherichia, Salmonella, Shigella e Yersinia) e utilizada no caso específico da bactéria Klebsiella pneumoniae str. Kp13, causadora de infecção nosocomial isolada no Brasil. A metodologia se provou capaz de detectar e filtrar SNPs em diferentes espécies da família Enterobacteriaceae em concordância com dados já publicados. Para as 4 estirpes de Klebsiella pneumoniae foi observada a ocorrência desse tipo de polimorfismo entre as estirpes comparadas. Desta maneira, seqüências codificantes com um número de SNPs maior que a freqüência esperada, obtida com a Distribuição de Probabilidade de Poisson, foram investigadas para averiguação da sua possível associação com o estilo de vida bacteriano.Single nucleotide polymorphism, SNP, are common and may be responsible for di_erent phenotypes. The attention around this type of polymorphism was intensi_ed when it was discovered, through the sequencing project of the human genome, that they were responsible for most of the genetic variability (90%) of complete human genomes compared. Thus, presenting a frequency of occurrence of one SNP per 1.000-2.000bp intervals. Recently, several studies have focused on the detection of this type of polymorphism in bacterial genomes for use in bacterial strain typing and phylogeny reconstruction, for example. In this work we developed a methodology for detecting and _ltering SNPs for bacterial genomes in order to analyze the prevalence of this type of polymorphism. The methodology involves the use of sequence alignment algorithms and _lters developed in PERL programming language for the detection and filtering of SNPs in order to obtain a reliable final set. The occurrence of SNPs fits the concept of Poisson probability distribution because they are events that occur in an interval, in this case, coding sequences. Within this context, we also calculated the expected frequency of SNPs for each case using a Poisson probability distribution. SNPs that exceeded the expected frequency may be subject to diferent selective pressure. The methodology was tested and evaluated for genomes in five genera of the family Enterobacteriaceae (Enterobacter, Escherichia, Salmonella, Shigella and Yersinia) and used in the case study of Klebsiella pneumoniae str. Kp13 genome, a bacteria causing nosocomial infection. The methodology has been able to detect and filter SNPs in diferent species of the family Enterobacteriaceae in accordance with data already published. For the four Klebsiella pneumoniae strains analyzed the occurrence of such polymorphism between the strains compared was observed. Thus, coding sequences with a number of SNPs higher than the expected frequency, obtained by the Poisson Probability Distribution, have been investigated to assess its possible association with the bacteria lifestyle.Laboratório Nacional de Computação CientíficaServiço de Análise e Apoio a Formação de Recursos HumanosBrLNCCPrograma de Pós-Graduação em Modelagem ComputacionalNicolás, Marisa FabianaCantão, Mauricio EgidioCPF:21257053892CPF:28596039805http://lattes.cnpq.br/0717161560405537http://lattes.cnpq.br/6154630512714298Porto, Fabio Andre MachadoCPF:88404595704http://lattes.cnpq.br/6418711808050575Picão, Renata CristinaCPF:30292767838http://lattes.cnpq.br/3656759928090726Lima, Nicholas Costa Barroso2015-03-04T18:57:46Z2013-07-082011-12-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://tede.lncc.br/handle/tede/153porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCC2018-07-04T12:59:42Zoai:tede-server.lncc.br:tede/153Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2018-07-04T12:59:42Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false |
dc.title.none.fl_str_mv |
Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos Compuitational approach for detection and analysis of single-nucleotide polymorphisms SNPS)in bacterial genomes |
title |
Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos |
spellingShingle |
Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos Lima, Nicholas Costa Barroso Bioinformática Bioinformatics CNPQ::CIENCIAS BIOLOGICAS::GENETICA |
title_short |
Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos |
title_full |
Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos |
title_fullStr |
Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos |
title_full_unstemmed |
Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos |
title_sort |
Abordagem computacional para detecção e análise de polimorfismos de nucleotídeo único em genomas bacterianos |
author |
Lima, Nicholas Costa Barroso |
author_facet |
Lima, Nicholas Costa Barroso |
author_role |
author |
dc.contributor.none.fl_str_mv |
Nicolás, Marisa Fabiana Cantão, Mauricio Egidio CPF:21257053892 CPF:28596039805 http://lattes.cnpq.br/0717161560405537 http://lattes.cnpq.br/6154630512714298 Porto, Fabio Andre Machado CPF:88404595704 http://lattes.cnpq.br/6418711808050575 Picão, Renata Cristina CPF:30292767838 http://lattes.cnpq.br/3656759928090726 |
dc.contributor.author.fl_str_mv |
Lima, Nicholas Costa Barroso |
dc.subject.por.fl_str_mv |
Bioinformática Bioinformatics CNPQ::CIENCIAS BIOLOGICAS::GENETICA |
topic |
Bioinformática Bioinformatics CNPQ::CIENCIAS BIOLOGICAS::GENETICA |
description |
Polimorfismos de Unico Nucleotídeo, SNP, são freqüentes e podem ser responsáveis por diferentes fenótipos. A atenção em torno deste tipo de polimorfismo se intensificou quando se descobriu, através do projeto de seqüenciamento do genoma humano, que eram responsáveis pela maior parte da variabilidade genética (90%) entre genomas humanos completos comparados. Com isso apresentando uma freqüência de ocorrência de 1 SNP em intervalos de 1.000-2.000pb. Recentemente vários estudos se concentraram na detecção desse tipo de polimorfismo em genomas bacterianos para uso em tipagem de estirpes e reconstrução de filogenia, por exemplo. Neste trabalho foi desenvolvida uma metodologia de detecção e filtragem de SNPs para genomas bacterianos visando a análise da prevalência desse tipo de polimorfismo. A metodologia envolve o uso de algoritmos de alinhamento de seqüência e filtros desenvolvidos na linguagem de programação PERL para a detecção e filtragem de SNPs com a finalidade de se obter um conjunto final confiável. A ocorrência de SNPs se encaixa no conceito de distribuição de probabilidade de Poisson por serem eventos que ocorrem em um intervalo, nesse caso, seqüência codificantes. Dentro deste contexto, também foi calculada a freqüência esperada de SNPs para cada caso estudado usando uma distribuição de probabilidade de Poisson. Microrganismos que apresentem SNPs em uma freqüência acima da esperada podem estar sujeitos a pressões seletivas diferenciadas. A metodologia foi testada e avaliada para genomas em cinco gêneros da família Enterobacteriaceae (Enterobacter, Escherichia, Salmonella, Shigella e Yersinia) e utilizada no caso específico da bactéria Klebsiella pneumoniae str. Kp13, causadora de infecção nosocomial isolada no Brasil. A metodologia se provou capaz de detectar e filtrar SNPs em diferentes espécies da família Enterobacteriaceae em concordância com dados já publicados. Para as 4 estirpes de Klebsiella pneumoniae foi observada a ocorrência desse tipo de polimorfismo entre as estirpes comparadas. Desta maneira, seqüências codificantes com um número de SNPs maior que a freqüência esperada, obtida com a Distribuição de Probabilidade de Poisson, foram investigadas para averiguação da sua possível associação com o estilo de vida bacteriano. |
publishDate |
2011 |
dc.date.none.fl_str_mv |
2011-12-01 2013-07-08 2015-03-04T18:57:46Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://tede.lncc.br/handle/tede/153 |
url |
https://tede.lncc.br/handle/tede/153 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Laboratório Nacional de Computação Científica Serviço de Análise e Apoio a Formação de Recursos Humanos Br LNCC Programa de Pós-Graduação em Modelagem Computacional |
publisher.none.fl_str_mv |
Laboratório Nacional de Computação Científica Serviço de Análise e Apoio a Formação de Recursos Humanos Br LNCC Programa de Pós-Graduação em Modelagem Computacional |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do LNCC instname:Laboratório Nacional de Computação Científica (LNCC) instacron:LNCC |
instname_str |
Laboratório Nacional de Computação Científica (LNCC) |
instacron_str |
LNCC |
institution |
LNCC |
reponame_str |
Biblioteca Digital de Teses e Dissertações do LNCC |
collection |
Biblioteca Digital de Teses e Dissertações do LNCC |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC) |
repository.mail.fl_str_mv |
library@lncc.br||library@lncc.br |
_version_ |
1816081206068903936 |