Análise de diferentes métodos de sequenciamento de larga escala dos genes envolvidos no hipopituitarismo e embriogênese hipofisária

Detalhes bibliográficos
Autor(a) principal: Benedetti, Anna Flavia Figueredo
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: http://www.teses.usp.br/teses/disponiveis/5/5135/tde-03072019-102945/
Resumo: Mutações nos genes envolvidos na embriogênese hipofisária já foram descritas relacionadas a quadros isolados de deficiência hormonal múltipla e/ou associado a fenótipos extra-pituitários. As mutações encontradas em humanos foram descritas em genes envolvidos na embriogênese hipofisária e cujos fenótipos foram gerados em animais a partir de nocaute, servindo de ponto de partida para sua busca em pacientes com fenótipo similar. Essa estratégia é conhecida como busca por gene candidato, e é feita pela técnica de sequenciamento tradicional Sanger. Na última década, com o avanço de novas tecnologias de sequenciamento, diversos genes foram associados ao hipopituitarismo, principalmente utilizando-se a metodologia de exoma. Contudo, ainda há uma grande parcela dessa população sem diagnóstico molecular, como evidenciado em um levantamento na literatura por Fang e colaboradores e cuja tendência foi observada no ambulatório de Endocrinologia do Desenvolvimento do Hospital das Clínicas, onde apenas 14% dos pacientes tiveram o seu diagnóstico molecular determinado. Com isso, as tecnologias de sequenciamento de última geração, passaram a ser uma ferramenta promissora para determinação molecular dos fenótipos dos pacientes. Logo, alguns pacientes em seguimento no ambulatório de endocrinologia do desenvolvimento tiveram o exoma sequenciado, e uma análise das métricas do sequenciamento evidenciou regiões de cobertura muito baixa, o que não permitiu a conclusão sobre a presença ou ausência de variantes nessas regiões. Entre essas regiões estão os genes SOX2 e SOX3, os quais possuem variantes conhecidas causadoras do fenótipo. Esse trabalho tem como objetivo analisar a cobertura dos genes envolvidos na embriogênese hipofisária assim como os relacionados ao hipopituitarismo congênito em quatro diferentes kits de preparação de biblioteca para exoma, a fim de identificar a melhor metodologia para um diagnóstico molecular dos pacientes alem determinar variantes especificas da população brasileira na região de interesse através de busca no site ABraOM. Foram analisados 76 genes em um total de 119 amostras separadas em três grupos, sendo o primeiro grupo de amostras HapMap, o segundo de um paciente com hipopituitarismo e sua mãe e o terceiro de amostras brasileiras aleatórias. Os kits utilizados foram NimbleGen (Roche), Nextera (Illumina), SureSelect e SureSelect+UTR (Agilent). Para isso, foram utilizados diversos programas de bioinformática, tendo entre eles o FASTQC, BWA, GATK, Annovar, Qualimap e bedTools. Análises da qualidade do sequenciamento, assim como a taxa de mapeamento e duplicação mostraram que as amostras utilizadas apresentavam qualidades adequadas e similares entre si para a análise. De acordo com os resultados obtidos em relação a cobertura, o kit da NimbleGen apresenta uma queda em sua cobertura dos genes de interesse em relação a sua capacidade de cobertura do exoma global, algo que pode ser devido à alta taxa de GC na região de interesse, uma vez que a capacidade do kit nessas regiões é deficiente em relação aos demais. Os genes com piores coberturas em todas as quatro tecnologias foram os genes HES5, que apesar de fazer parte da embriologia hipofisária, não possui variante relacionada ao fenótipo em humanos, e o SOX3 que, apesar de ter muita baixa cobertura na NimbleGen, é bem coberto na SureSelect. Isso corrobora com a análise de capacidade de cobertura em regiões com alta taxa de GC. Somado a isso observou-se que a população brasileira tem 885 variantes únicas e exclusivas. Concluímos, portanto, que o kit SureSelect, da Agilent, tem o melhor desempenho na região de interesse, assim como no exoma global, sendo o indicado para estudos em coortes de hipopituitarismo e a população brasileira possui variantes únicas inerentes a ela
id USP_e2bbf9ea5e8e724d2986bceedc538f5c
oai_identifier_str oai:teses.usp.br:tde-03072019-102945
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Análise de diferentes métodos de sequenciamento de larga escala dos genes envolvidos no hipopituitarismo e embriogênese hipofisáriaAnalysis of different methods of high-throughput sequencing of genes involved in hypopituitarism and pituitary embryogenesisBiologia ComputacionalBiologia MolecularComputational BiologyExomaExomeHipopituitarismoHypopituitarismKits de Reagente para DiagnósticoMolecular BiologyReagent Kits DiagnosticSequenciamento Completo do ExomaWhole exome sequencingMutações nos genes envolvidos na embriogênese hipofisária já foram descritas relacionadas a quadros isolados de deficiência hormonal múltipla e/ou associado a fenótipos extra-pituitários. As mutações encontradas em humanos foram descritas em genes envolvidos na embriogênese hipofisária e cujos fenótipos foram gerados em animais a partir de nocaute, servindo de ponto de partida para sua busca em pacientes com fenótipo similar. Essa estratégia é conhecida como busca por gene candidato, e é feita pela técnica de sequenciamento tradicional Sanger. Na última década, com o avanço de novas tecnologias de sequenciamento, diversos genes foram associados ao hipopituitarismo, principalmente utilizando-se a metodologia de exoma. Contudo, ainda há uma grande parcela dessa população sem diagnóstico molecular, como evidenciado em um levantamento na literatura por Fang e colaboradores e cuja tendência foi observada no ambulatório de Endocrinologia do Desenvolvimento do Hospital das Clínicas, onde apenas 14% dos pacientes tiveram o seu diagnóstico molecular determinado. Com isso, as tecnologias de sequenciamento de última geração, passaram a ser uma ferramenta promissora para determinação molecular dos fenótipos dos pacientes. Logo, alguns pacientes em seguimento no ambulatório de endocrinologia do desenvolvimento tiveram o exoma sequenciado, e uma análise das métricas do sequenciamento evidenciou regiões de cobertura muito baixa, o que não permitiu a conclusão sobre a presença ou ausência de variantes nessas regiões. Entre essas regiões estão os genes SOX2 e SOX3, os quais possuem variantes conhecidas causadoras do fenótipo. Esse trabalho tem como objetivo analisar a cobertura dos genes envolvidos na embriogênese hipofisária assim como os relacionados ao hipopituitarismo congênito em quatro diferentes kits de preparação de biblioteca para exoma, a fim de identificar a melhor metodologia para um diagnóstico molecular dos pacientes alem determinar variantes especificas da população brasileira na região de interesse através de busca no site ABraOM. Foram analisados 76 genes em um total de 119 amostras separadas em três grupos, sendo o primeiro grupo de amostras HapMap, o segundo de um paciente com hipopituitarismo e sua mãe e o terceiro de amostras brasileiras aleatórias. Os kits utilizados foram NimbleGen (Roche), Nextera (Illumina), SureSelect e SureSelect+UTR (Agilent). Para isso, foram utilizados diversos programas de bioinformática, tendo entre eles o FASTQC, BWA, GATK, Annovar, Qualimap e bedTools. Análises da qualidade do sequenciamento, assim como a taxa de mapeamento e duplicação mostraram que as amostras utilizadas apresentavam qualidades adequadas e similares entre si para a análise. De acordo com os resultados obtidos em relação a cobertura, o kit da NimbleGen apresenta uma queda em sua cobertura dos genes de interesse em relação a sua capacidade de cobertura do exoma global, algo que pode ser devido à alta taxa de GC na região de interesse, uma vez que a capacidade do kit nessas regiões é deficiente em relação aos demais. Os genes com piores coberturas em todas as quatro tecnologias foram os genes HES5, que apesar de fazer parte da embriologia hipofisária, não possui variante relacionada ao fenótipo em humanos, e o SOX3 que, apesar de ter muita baixa cobertura na NimbleGen, é bem coberto na SureSelect. Isso corrobora com a análise de capacidade de cobertura em regiões com alta taxa de GC. Somado a isso observou-se que a população brasileira tem 885 variantes únicas e exclusivas. Concluímos, portanto, que o kit SureSelect, da Agilent, tem o melhor desempenho na região de interesse, assim como no exoma global, sendo o indicado para estudos em coortes de hipopituitarismo e a população brasileira possui variantes únicas inerentes a elaMutations in the genes involved in pituitary embryogenesis have been described related to isolated cases of multiple hormonal deficiency and/or associated with extra-pituitary phenotypes. Mutations found in humans were described in genes involved in pituitary embryogenesis by generating phenotypes knockout animals, serving as the starting point for their search in patients with similar phenotype. This strategy is known as gene candidate search and is performed by the traditional Sanger sequencing technique. In the last decade, with the advancement of new sequencing technologies, several genes have been associated with hypopituitarism, mainly using the exome methodology. However, there is still a large portion of this population without molecular diagnosis, as evidenced by a survey in the literature by Fang et al., This trend was also observed in the outpatient clinic of Developmental Endocrinology of Hospital das Clínicas, where only 14% of the patients had their molecular diagnosis. With this, high throughput sequencing technologies have become a promising tool for the molecular determination of patients\' phenotypes. Therefore, we sequenced the exome of some of our patients, and an analysis of the sequencing quality showed very low coverage regions, which harms the researcher\'s ability to reach a conclusion regarding presence or lack of variants in these regions. Among these regions are the SOX2 and SOX3 genes, which have many variants that are known to cause the phenotype. This work aims to analyze the coverage of the genes involved in pituitary embryogenesis as well as those related to congenital hypopituitarism in four different exome library preparation kits in order to identify the best methodology for a molecular diagnosis of the patients and to determine specific variants of the Brazilian population in the region of interest by searching the ABraOM website. A total of 76 genes were analyzed in a total of 119 samples in three groups: the first group of HapMap samples, the second of a patient with hypopituitarism and his mother, and the third group of random Brazilian samples. The kits used were NimbleGen (Roche), Nextera (Illumina), SureSelect and SureSelect + UTR (Agilent). For this, several bioinformatics programs were used, among them FASTQC, BWA, GATK, Annovar, Qualimap and bedTools. Sequencing quality analysis, as well as the mapping and duplication rate, showed that the samples used presented adequate and similar qualities for the comparison. According to the results obtained in relation to the coverage, the NimbleGen kit shows a drop in its coverage of the genes of interest in relation to its capacity to cover the global exome, something that may be due to the high GC rate in the region of interest, once the capacity of the kit in these regions is not as good as the others. The genes with the worst coverage in all four technologies were the HES5 gene, which despite being part of the pituitary embryology, have no phenotype-related variant in humans, and SOX3 which, despite having very low coverage in NimbleGen, is well covered on SureSelect. This corroborates the analysis of coverage capacity in regions with a high GC rate. In addition to this it was observed that the Brazilian population has 885 unique and exclusive variants. Therefore, we conclude that the Agilent\'s SureSelect kit has the best performance in the region of interest, as well as in the global exome, being recommended for studies in hypopituitarism cohorts, and that the Brazilian population has unique variants inherent to itBiblioteca Digitais de Teses e Dissertações da USPCarvalho, Luciani Renata Silveira deTahira, Ana CarolinaBenedetti, Anna Flavia Figueredo2019-04-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/5/5135/tde-03072019-102945/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2019-07-04T17:50:24Zoai:teses.usp.br:tde-03072019-102945Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212019-07-04T17:50:24Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Análise de diferentes métodos de sequenciamento de larga escala dos genes envolvidos no hipopituitarismo e embriogênese hipofisária
Analysis of different methods of high-throughput sequencing of genes involved in hypopituitarism and pituitary embryogenesis
title Análise de diferentes métodos de sequenciamento de larga escala dos genes envolvidos no hipopituitarismo e embriogênese hipofisária
spellingShingle Análise de diferentes métodos de sequenciamento de larga escala dos genes envolvidos no hipopituitarismo e embriogênese hipofisária
Benedetti, Anna Flavia Figueredo
Biologia Computacional
Biologia Molecular
Computational Biology
Exoma
Exome
Hipopituitarismo
Hypopituitarism
Kits de Reagente para Diagnóstico
Molecular Biology
Reagent Kits Diagnostic
Sequenciamento Completo do Exoma
Whole exome sequencing
title_short Análise de diferentes métodos de sequenciamento de larga escala dos genes envolvidos no hipopituitarismo e embriogênese hipofisária
title_full Análise de diferentes métodos de sequenciamento de larga escala dos genes envolvidos no hipopituitarismo e embriogênese hipofisária
title_fullStr Análise de diferentes métodos de sequenciamento de larga escala dos genes envolvidos no hipopituitarismo e embriogênese hipofisária
title_full_unstemmed Análise de diferentes métodos de sequenciamento de larga escala dos genes envolvidos no hipopituitarismo e embriogênese hipofisária
title_sort Análise de diferentes métodos de sequenciamento de larga escala dos genes envolvidos no hipopituitarismo e embriogênese hipofisária
author Benedetti, Anna Flavia Figueredo
author_facet Benedetti, Anna Flavia Figueredo
author_role author
dc.contributor.none.fl_str_mv Carvalho, Luciani Renata Silveira de
Tahira, Ana Carolina
dc.contributor.author.fl_str_mv Benedetti, Anna Flavia Figueredo
dc.subject.por.fl_str_mv Biologia Computacional
Biologia Molecular
Computational Biology
Exoma
Exome
Hipopituitarismo
Hypopituitarism
Kits de Reagente para Diagnóstico
Molecular Biology
Reagent Kits Diagnostic
Sequenciamento Completo do Exoma
Whole exome sequencing
topic Biologia Computacional
Biologia Molecular
Computational Biology
Exoma
Exome
Hipopituitarismo
Hypopituitarism
Kits de Reagente para Diagnóstico
Molecular Biology
Reagent Kits Diagnostic
Sequenciamento Completo do Exoma
Whole exome sequencing
description Mutações nos genes envolvidos na embriogênese hipofisária já foram descritas relacionadas a quadros isolados de deficiência hormonal múltipla e/ou associado a fenótipos extra-pituitários. As mutações encontradas em humanos foram descritas em genes envolvidos na embriogênese hipofisária e cujos fenótipos foram gerados em animais a partir de nocaute, servindo de ponto de partida para sua busca em pacientes com fenótipo similar. Essa estratégia é conhecida como busca por gene candidato, e é feita pela técnica de sequenciamento tradicional Sanger. Na última década, com o avanço de novas tecnologias de sequenciamento, diversos genes foram associados ao hipopituitarismo, principalmente utilizando-se a metodologia de exoma. Contudo, ainda há uma grande parcela dessa população sem diagnóstico molecular, como evidenciado em um levantamento na literatura por Fang e colaboradores e cuja tendência foi observada no ambulatório de Endocrinologia do Desenvolvimento do Hospital das Clínicas, onde apenas 14% dos pacientes tiveram o seu diagnóstico molecular determinado. Com isso, as tecnologias de sequenciamento de última geração, passaram a ser uma ferramenta promissora para determinação molecular dos fenótipos dos pacientes. Logo, alguns pacientes em seguimento no ambulatório de endocrinologia do desenvolvimento tiveram o exoma sequenciado, e uma análise das métricas do sequenciamento evidenciou regiões de cobertura muito baixa, o que não permitiu a conclusão sobre a presença ou ausência de variantes nessas regiões. Entre essas regiões estão os genes SOX2 e SOX3, os quais possuem variantes conhecidas causadoras do fenótipo. Esse trabalho tem como objetivo analisar a cobertura dos genes envolvidos na embriogênese hipofisária assim como os relacionados ao hipopituitarismo congênito em quatro diferentes kits de preparação de biblioteca para exoma, a fim de identificar a melhor metodologia para um diagnóstico molecular dos pacientes alem determinar variantes especificas da população brasileira na região de interesse através de busca no site ABraOM. Foram analisados 76 genes em um total de 119 amostras separadas em três grupos, sendo o primeiro grupo de amostras HapMap, o segundo de um paciente com hipopituitarismo e sua mãe e o terceiro de amostras brasileiras aleatórias. Os kits utilizados foram NimbleGen (Roche), Nextera (Illumina), SureSelect e SureSelect+UTR (Agilent). Para isso, foram utilizados diversos programas de bioinformática, tendo entre eles o FASTQC, BWA, GATK, Annovar, Qualimap e bedTools. Análises da qualidade do sequenciamento, assim como a taxa de mapeamento e duplicação mostraram que as amostras utilizadas apresentavam qualidades adequadas e similares entre si para a análise. De acordo com os resultados obtidos em relação a cobertura, o kit da NimbleGen apresenta uma queda em sua cobertura dos genes de interesse em relação a sua capacidade de cobertura do exoma global, algo que pode ser devido à alta taxa de GC na região de interesse, uma vez que a capacidade do kit nessas regiões é deficiente em relação aos demais. Os genes com piores coberturas em todas as quatro tecnologias foram os genes HES5, que apesar de fazer parte da embriologia hipofisária, não possui variante relacionada ao fenótipo em humanos, e o SOX3 que, apesar de ter muita baixa cobertura na NimbleGen, é bem coberto na SureSelect. Isso corrobora com a análise de capacidade de cobertura em regiões com alta taxa de GC. Somado a isso observou-se que a população brasileira tem 885 variantes únicas e exclusivas. Concluímos, portanto, que o kit SureSelect, da Agilent, tem o melhor desempenho na região de interesse, assim como no exoma global, sendo o indicado para estudos em coortes de hipopituitarismo e a população brasileira possui variantes únicas inerentes a ela
publishDate 2019
dc.date.none.fl_str_mv 2019-04-18
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/5/5135/tde-03072019-102945/
url http://www.teses.usp.br/teses/disponiveis/5/5135/tde-03072019-102945/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090341297455104