Aplicação de abordagens bioinformáticas no estudo da estrutura populacional de Trypanosoma cruzi

Detalhes bibliográficos
Autor(a) principal: Rodrigo de Paula Baptista
Data de Publicação: 2014
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/BUBD-9ZWJLV
Resumo: A doença de Chagas, causada pelo protozoário Trypanosoma cruzi, apresenta diferentes manifestações clínicas, resultantes de uma interação complexa entre fatores ambientais e genéticos tanto do hospedeiro quanto do parasito. Com relação aos fatores genéticos do parasito, uma variedade de estudos biológicos e moleculares revelou uma substancial variabilidade gênica entre populações de T. cruzi. De fato, em 2009, O táxon T. cruzi foi subdividido em seis linhagens ou DTUs principais (TcI-VI). Os aspectos epidemiológicos associados às diferentes linhagens ainda não estão bem definidos, mas já há evidências de associação, pelo menos parcial, com a distribuição geográfica, ciclos de transmissão e aspectos clínicos da doença. Todavia vários aspectos da estrutura populacional do parasito ainda necessitam esclarecimentos. Por exemplo, o modo de reprodução, a origem das seis linhagens e as relações com os seus aspectos epidemiológicos. No presente trabalho procurou-se desenvolver ou aperfeiçoar procedimentos moleculares, e computacionais que permitissem investigar e dissecar a complexidade da estrutura populacional de T. cruzi. Para tanto, foram propostos os seguintes objetivos (i) investigar a estratégia de reprodução do T. cruzi; (ii) buscar novas metodologias de caracterização molecular capazes de diferenciar as diferentes linhagens de T. cruzi em futuros ensaios multiplex de PCR; (iii) sequenciar o genoma de uma linhagem ainda não disponível nos bancos de dados públicos e realizar uma analise comparativa com seus dados genômicos a fim de resolver a origem ancestral das seis linhagens filogenéticas propostas; (iv) e, por fim, desenvolver uma metodologia computacional de agrupamento capaz de reconhecer padrões responsáveis pela divisão das linhagens e gerar regiões candidatas para o desenho de iniciadores para novos ensaios de caracterização molecular. Baseados em marcadores nucleares e mitocondriais e em parâmetros de genética populacional, analisamos dois grupos de isolados de T. cruzi: um proveniente diferentes regiões da América Latina e outros obtidos exclusivamente de pacientes do Estado de Minas Gerais. Nossos resultados, ao contrário daqueles majoritariamente encontrados na literatura, não suportam uma estrutura de população essencialmente clonal para T. cruzi, ao menos para TcII coexistindo em uma mesma área geográfica, sugerindo que as trocas genéticas entre cepas estreitamente relacionadas geograficamente são mais frequentes do que inicialmente esperado. Baseado na técnica de caracterização alelo específica BI-PASA, nós selecionamos uma variação no gene NAD desidrogenase subunidade I (ND1) de T. cruzi, e nossos resultados demostraram que esta metodologia foi eficaz, sendo rápida e mais barata, tornando-se uma boa candidata a ser utilizada em futuros ensaios de caracterização destes haplótipos. O genoma do clone da cepa 231 pertencente à linhagem TcIII foi sequenciado e para a montagem foi desenvolvida uma abordagem de montagem combinada de diferentes metodologias capaz de melhorar a acurácia da montagem deste genoma de conteúdo altamente repetitivo. Posteriormente, nós realizamos uma análise comparativa entre o genoma da cepa 231 montado e os demais disponíveis em bancos de dados e selecionamos genes altamente conservados, que foram utilizados em análises filogenéticas. Os resultados obtidos apontam para uma nova hipótese de origem das seis linhagens filogenéticas de T. cruzi e nos permitiram concluir que a linhagem TcIII, diferentemente do que foi proposto por diversos trabalhos, não é uma linhagem híbrida. Sequências gênicas codificadoras de proteínas altamente repetivivas e variáveis, como a amastina, de diferentes linhagens do parasito foram analisadas em um script criado por nosso grupo baseado em decomposição de valores singulares e K-means juntamente com uma análise de regressão logística, resultando na geração de regiões candidatas responsáveis pela divisão destas sequências em grupos, que foram similares à divisão filogenética esperada. Esta metodologia poderá ser aplicada futuramente a outros grupos gênicos para elaboração de novas metodologias de caracterização molecular. As metodologias desenvolvidas e os resultados obtidos neste trabalho contribuem para um melhor entendimento da complexidade da estrutura populacional de T. cruzi.
id UFMG_f6556d449e39910c35e8e9abc44ed625
oai_identifier_str oai:repositorio.ufmg.br:1843/BUBD-9ZWJLV
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Andrea Mara MacedoDaniella Castanheira BartholomeuRodrigo de Paula Baptista2019-08-10T14:29:17Z2019-08-10T14:29:17Z2014-08-19http://hdl.handle.net/1843/BUBD-9ZWJLVA doença de Chagas, causada pelo protozoário Trypanosoma cruzi, apresenta diferentes manifestações clínicas, resultantes de uma interação complexa entre fatores ambientais e genéticos tanto do hospedeiro quanto do parasito. Com relação aos fatores genéticos do parasito, uma variedade de estudos biológicos e moleculares revelou uma substancial variabilidade gênica entre populações de T. cruzi. De fato, em 2009, O táxon T. cruzi foi subdividido em seis linhagens ou DTUs principais (TcI-VI). Os aspectos epidemiológicos associados às diferentes linhagens ainda não estão bem definidos, mas já há evidências de associação, pelo menos parcial, com a distribuição geográfica, ciclos de transmissão e aspectos clínicos da doença. Todavia vários aspectos da estrutura populacional do parasito ainda necessitam esclarecimentos. Por exemplo, o modo de reprodução, a origem das seis linhagens e as relações com os seus aspectos epidemiológicos. No presente trabalho procurou-se desenvolver ou aperfeiçoar procedimentos moleculares, e computacionais que permitissem investigar e dissecar a complexidade da estrutura populacional de T. cruzi. Para tanto, foram propostos os seguintes objetivos (i) investigar a estratégia de reprodução do T. cruzi; (ii) buscar novas metodologias de caracterização molecular capazes de diferenciar as diferentes linhagens de T. cruzi em futuros ensaios multiplex de PCR; (iii) sequenciar o genoma de uma linhagem ainda não disponível nos bancos de dados públicos e realizar uma analise comparativa com seus dados genômicos a fim de resolver a origem ancestral das seis linhagens filogenéticas propostas; (iv) e, por fim, desenvolver uma metodologia computacional de agrupamento capaz de reconhecer padrões responsáveis pela divisão das linhagens e gerar regiões candidatas para o desenho de iniciadores para novos ensaios de caracterização molecular. Baseados em marcadores nucleares e mitocondriais e em parâmetros de genética populacional, analisamos dois grupos de isolados de T. cruzi: um proveniente diferentes regiões da América Latina e outros obtidos exclusivamente de pacientes do Estado de Minas Gerais. Nossos resultados, ao contrário daqueles majoritariamente encontrados na literatura, não suportam uma estrutura de população essencialmente clonal para T. cruzi, ao menos para TcII coexistindo em uma mesma área geográfica, sugerindo que as trocas genéticas entre cepas estreitamente relacionadas geograficamente são mais frequentes do que inicialmente esperado. Baseado na técnica de caracterização alelo específica BI-PASA, nós selecionamos uma variação no gene NAD desidrogenase subunidade I (ND1) de T. cruzi, e nossos resultados demostraram que esta metodologia foi eficaz, sendo rápida e mais barata, tornando-se uma boa candidata a ser utilizada em futuros ensaios de caracterização destes haplótipos. O genoma do clone da cepa 231 pertencente à linhagem TcIII foi sequenciado e para a montagem foi desenvolvida uma abordagem de montagem combinada de diferentes metodologias capaz de melhorar a acurácia da montagem deste genoma de conteúdo altamente repetitivo. Posteriormente, nós realizamos uma análise comparativa entre o genoma da cepa 231 montado e os demais disponíveis em bancos de dados e selecionamos genes altamente conservados, que foram utilizados em análises filogenéticas. Os resultados obtidos apontam para uma nova hipótese de origem das seis linhagens filogenéticas de T. cruzi e nos permitiram concluir que a linhagem TcIII, diferentemente do que foi proposto por diversos trabalhos, não é uma linhagem híbrida. Sequências gênicas codificadoras de proteínas altamente repetivivas e variáveis, como a amastina, de diferentes linhagens do parasito foram analisadas em um script criado por nosso grupo baseado em decomposição de valores singulares e K-means juntamente com uma análise de regressão logística, resultando na geração de regiões candidatas responsáveis pela divisão destas sequências em grupos, que foram similares à divisão filogenética esperada. Esta metodologia poderá ser aplicada futuramente a outros grupos gênicos para elaboração de novas metodologias de caracterização molecular. As metodologias desenvolvidas e os resultados obtidos neste trabalho contribuem para um melhor entendimento da complexidade da estrutura populacional de T. cruzi.Chagas disease, caused by the protozoan parasite Trypanosoma cruzi, has different clinical manifestations, that result from complex host-parasite interactions and involves both genetic and environmental factors. Regarding the parasite genetic factors, a variety of biological and molecular studies revealed an extensive genetic variability among T. cruzi strains, which were recently classified into six major lineages or DTUs (TcI-VI). Epidemiological aspects associated with these different lineages are not well defined, but there are some evidences of association with geographic distribution, transmission cycles and clinical aspects of this disease. Thus, in order to thoroughly investigate the population structure of this parasite, the efforts of our research group have been focused on developing new methodologies for T. cruzi characterization and study of the Chagas disease molecular epidemiology. In this present work, we seek to develop molecular and computational procedures enabling us to elucidate and dissect the complexity of population structure of T. cruzi. To this end, we proposed (i) to investigate the mode of reproduction of T. cruzi and search new molecular markers able to differentiate all six T. cruzi phylogenetic lineages and that could be used to develop multiplex assays; (ii) sequencing the genome of 231 strain, a representative of TcIII, a DTU not yet sampled in T. cruzi genome projects, and perform comparative genomic analyses to better resolve the ancestral origin of these six lineages (iii) and develop a sequence clustering methodology capable of recognizing sequences patterns responsible for the division of T. cruzi DTUs and based on this analysis identify novel candidate regions for molecular characterization assays. Using population genetic approaches, we analyzed both nuclear and mitochondrial markers in two groups of T. cruzi: one using strains isolated from different regions of Latin America and another using strains isolated exclusively from the Minas Gerais state, in Brazil. Our results, unlike those mostly found in literature, does not support an clonal population structure for T. cruzi, at least for TcII coexisting in the same geographic area, suggesting that genetic exchange between geographically closely related strains are more frequent than initially expected. The perspective is to incorporate the selected target in a multiplex PCR assay suitable for the study of T. cruzi populations present in tissues of chronic chagasic patients. Based on the Bi-PASA technique of allele specific characterization, we select a SNP variation in the T. cruzi ND1 mitochondrial gene, and our results showed that this methodology was effective, faster and cheaper than the RFLP-PCR array, making it a good candidate to be used in future mitochondrial haplotypes characterization tests. The genome of the 231 clone, which belongs to the TcIII lineage, was sequenced and for the assembly we have developed a combined approach using different methodologies to improve the assembly accuracy of this highly repetitive genome. Subsequently, we performed a comparative analysis between 231 genome and the other T. cruzi genomes available in public databases to selected highly conserved genes across the different strains to perform phylogenetic analyses. Based on our results, we propose a new hypothesis for the origin of the six T. cruzi DTUs and conclude that TcIII, unlike what has been proposed by several studies, is not a hybrid lineage. Surface protein gene sequences, which are highly repetitives and variable, such as amastin, from different strains of the parasite were analyzed using an in-house script based on singular value decomposition and K-means along with a logistic regression analysis. Using this approach, we identified candidate regions that recapture the T. cruzi phylogenetic division. This methodology can be applied to other gene groups for the development of novel molecular characterization assays. The methodologies developed during this study and our results contributed to better understand the complexity of T. cruzi population structure.Universidade Federal de Minas GeraisUFMGChagas, Doença deBioinformáticaGenética de populaçõesTrypanosoma cruziBioinformáticaAplicação de abordagens bioinformáticas no estudo da estrutura populacional de Trypanosoma cruziinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALtese_rodrigo_envio_biblioteca_final.pdfapplication/pdf3988298https://repositorio.ufmg.br/bitstream/1843/BUBD-9ZWJLV/1/tese_rodrigo_envio_biblioteca_final.pdf8d2a1c09c9d46b1c5af540973cf6d7c2MD51TEXTtese_rodrigo_envio_biblioteca_final.pdf.txttese_rodrigo_envio_biblioteca_final.pdf.txtExtracted texttext/plain291134https://repositorio.ufmg.br/bitstream/1843/BUBD-9ZWJLV/2/tese_rodrigo_envio_biblioteca_final.pdf.txt99b08eac0c16e69db43fd31f36e6d323MD521843/BUBD-9ZWJLV2019-11-14 09:24:29.171oai:repositorio.ufmg.br:1843/BUBD-9ZWJLVRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T12:24:29Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Aplicação de abordagens bioinformáticas no estudo da estrutura populacional de Trypanosoma cruzi
title Aplicação de abordagens bioinformáticas no estudo da estrutura populacional de Trypanosoma cruzi
spellingShingle Aplicação de abordagens bioinformáticas no estudo da estrutura populacional de Trypanosoma cruzi
Rodrigo de Paula Baptista
Bioinformática
Chagas, Doença de
Bioinformática
Genética de populações
Trypanosoma cruzi
title_short Aplicação de abordagens bioinformáticas no estudo da estrutura populacional de Trypanosoma cruzi
title_full Aplicação de abordagens bioinformáticas no estudo da estrutura populacional de Trypanosoma cruzi
title_fullStr Aplicação de abordagens bioinformáticas no estudo da estrutura populacional de Trypanosoma cruzi
title_full_unstemmed Aplicação de abordagens bioinformáticas no estudo da estrutura populacional de Trypanosoma cruzi
title_sort Aplicação de abordagens bioinformáticas no estudo da estrutura populacional de Trypanosoma cruzi
author Rodrigo de Paula Baptista
author_facet Rodrigo de Paula Baptista
author_role author
dc.contributor.advisor1.fl_str_mv Andrea Mara Macedo
dc.contributor.advisor-co1.fl_str_mv Daniella Castanheira Bartholomeu
dc.contributor.author.fl_str_mv Rodrigo de Paula Baptista
contributor_str_mv Andrea Mara Macedo
Daniella Castanheira Bartholomeu
dc.subject.por.fl_str_mv Bioinformática
topic Bioinformática
Chagas, Doença de
Bioinformática
Genética de populações
Trypanosoma cruzi
dc.subject.other.pt_BR.fl_str_mv Chagas, Doença de
Bioinformática
Genética de populações
Trypanosoma cruzi
description A doença de Chagas, causada pelo protozoário Trypanosoma cruzi, apresenta diferentes manifestações clínicas, resultantes de uma interação complexa entre fatores ambientais e genéticos tanto do hospedeiro quanto do parasito. Com relação aos fatores genéticos do parasito, uma variedade de estudos biológicos e moleculares revelou uma substancial variabilidade gênica entre populações de T. cruzi. De fato, em 2009, O táxon T. cruzi foi subdividido em seis linhagens ou DTUs principais (TcI-VI). Os aspectos epidemiológicos associados às diferentes linhagens ainda não estão bem definidos, mas já há evidências de associação, pelo menos parcial, com a distribuição geográfica, ciclos de transmissão e aspectos clínicos da doença. Todavia vários aspectos da estrutura populacional do parasito ainda necessitam esclarecimentos. Por exemplo, o modo de reprodução, a origem das seis linhagens e as relações com os seus aspectos epidemiológicos. No presente trabalho procurou-se desenvolver ou aperfeiçoar procedimentos moleculares, e computacionais que permitissem investigar e dissecar a complexidade da estrutura populacional de T. cruzi. Para tanto, foram propostos os seguintes objetivos (i) investigar a estratégia de reprodução do T. cruzi; (ii) buscar novas metodologias de caracterização molecular capazes de diferenciar as diferentes linhagens de T. cruzi em futuros ensaios multiplex de PCR; (iii) sequenciar o genoma de uma linhagem ainda não disponível nos bancos de dados públicos e realizar uma analise comparativa com seus dados genômicos a fim de resolver a origem ancestral das seis linhagens filogenéticas propostas; (iv) e, por fim, desenvolver uma metodologia computacional de agrupamento capaz de reconhecer padrões responsáveis pela divisão das linhagens e gerar regiões candidatas para o desenho de iniciadores para novos ensaios de caracterização molecular. Baseados em marcadores nucleares e mitocondriais e em parâmetros de genética populacional, analisamos dois grupos de isolados de T. cruzi: um proveniente diferentes regiões da América Latina e outros obtidos exclusivamente de pacientes do Estado de Minas Gerais. Nossos resultados, ao contrário daqueles majoritariamente encontrados na literatura, não suportam uma estrutura de população essencialmente clonal para T. cruzi, ao menos para TcII coexistindo em uma mesma área geográfica, sugerindo que as trocas genéticas entre cepas estreitamente relacionadas geograficamente são mais frequentes do que inicialmente esperado. Baseado na técnica de caracterização alelo específica BI-PASA, nós selecionamos uma variação no gene NAD desidrogenase subunidade I (ND1) de T. cruzi, e nossos resultados demostraram que esta metodologia foi eficaz, sendo rápida e mais barata, tornando-se uma boa candidata a ser utilizada em futuros ensaios de caracterização destes haplótipos. O genoma do clone da cepa 231 pertencente à linhagem TcIII foi sequenciado e para a montagem foi desenvolvida uma abordagem de montagem combinada de diferentes metodologias capaz de melhorar a acurácia da montagem deste genoma de conteúdo altamente repetitivo. Posteriormente, nós realizamos uma análise comparativa entre o genoma da cepa 231 montado e os demais disponíveis em bancos de dados e selecionamos genes altamente conservados, que foram utilizados em análises filogenéticas. Os resultados obtidos apontam para uma nova hipótese de origem das seis linhagens filogenéticas de T. cruzi e nos permitiram concluir que a linhagem TcIII, diferentemente do que foi proposto por diversos trabalhos, não é uma linhagem híbrida. Sequências gênicas codificadoras de proteínas altamente repetivivas e variáveis, como a amastina, de diferentes linhagens do parasito foram analisadas em um script criado por nosso grupo baseado em decomposição de valores singulares e K-means juntamente com uma análise de regressão logística, resultando na geração de regiões candidatas responsáveis pela divisão destas sequências em grupos, que foram similares à divisão filogenética esperada. Esta metodologia poderá ser aplicada futuramente a outros grupos gênicos para elaboração de novas metodologias de caracterização molecular. As metodologias desenvolvidas e os resultados obtidos neste trabalho contribuem para um melhor entendimento da complexidade da estrutura populacional de T. cruzi.
publishDate 2014
dc.date.issued.fl_str_mv 2014-08-19
dc.date.accessioned.fl_str_mv 2019-08-10T14:29:17Z
dc.date.available.fl_str_mv 2019-08-10T14:29:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/BUBD-9ZWJLV
url http://hdl.handle.net/1843/BUBD-9ZWJLV
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/BUBD-9ZWJLV/1/tese_rodrigo_envio_biblioteca_final.pdf
https://repositorio.ufmg.br/bitstream/1843/BUBD-9ZWJLV/2/tese_rodrigo_envio_biblioteca_final.pdf.txt
bitstream.checksum.fl_str_mv 8d2a1c09c9d46b1c5af540973cf6d7c2
99b08eac0c16e69db43fd31f36e6d323
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1801676615083622400