Characterization of genetic variants in 70 portuguese individuals

Detalhes bibliográficos
Autor(a) principal: Martins, Daniel Eduardo Fernandes
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/79939
Resumo: Dissertação de mestrado em Bioinformática
id RCAP_e8001ec4558eeaa4573ac36d7b6cade1
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/79939
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Characterization of genetic variants in 70 portuguese individualsGenómicaAlterações genéticasExomasDistribuição alélicaPopulaçãoGenomicsVariantsExomesAllele distributionPopulationCiências Naturais::Outras Ciências NaturaisDissertação de mestrado em BioinformáticaA análise genómica das populações tem contribuído significativamente para o aumento do número de SNVs descritos em bases de dados. Estudos populacionais prévios têm contribuído com 18 a 57% novas variantes. A nova informação genética é particularmente relevante enquanto referência para propósitos clínicos. Iniciativas à escala global como o 1000 Genomes Project (1kG) incluem populações Ibéricas, contudo, nenhum indivíduo Português foi incluído no mesmo grupo. Tanto quanto se sabe, nenhum indivíduo Português foi incluído no projeto gnomAD, o maior conjunto de dados genómicos atual. Acreditamos que uma coleção de informação genómica referente à população Portuguesa poderia trazer grandes benefícios ao diagnóstico molecular em pacientes Portugueses. As alterações genéticas detetadas em 70 indivíduos Portugueses foram inseridas em uma base de dados não-relacional. A informação publicada pelos projetos 1kG e gnomAD para cada alteração incluída nas mesmas foi adicionada à referida base de dados. Frequências alélicas reportadas para sete populações incluídas na base de dados do gnomAD, cinco populações do 1kG e 5 subpopulações Europeias do mesmo projeto foram comparadas contra os valores calculados para os nossos dados. As diferenças das distribuições alélicas foram testadas com o Fisher’s Exact test. Os p-values obtidos foram corrigidos de acordo com a sua False Discovery Rate (FDR). Os exomas de indivíduos Portugueses analisados continham 224,155 alterações genéticas filtradas de acordo com critérios de qualidade definidos no presente estudo. Aproximadamente 16,4% das variantes não se encontravam descritas nas bases de dados dos projetos 1kG e gnomAD. Os resultados obtidos endossam evidências, previamente descritas na literatura, de uma correlação entre as diferenças genéticas das populações comparadas em relação à população Portuguesa e a distância geográfica das mesmas a Portugal. Diferenças significativas entre distribuições alélicas da população estudada e outras subpopulações Europeias foram encontradas para 7,284 alterações genéticas distribuídas por 2,571 genes. Os resultados obtidos sugerem a existência de marcadores genéticos populacionais e podem motivar futuros estudos com vista a detetar marcadores genéticos específicos da população Portuguesa. O estudo apresentado representa uma contribuição significativa para, não só enriquecer iniciativas genómicas de grande escala, mas também para estabelecer uma referência auxiliar para análises genéticas a doentes Portugueses.The in-depth study of the genomics of single populations has contributed significantly to the enlargement of known SNVs in databases. Each single population study has contributed with 18 to 57% of novel SNVs. The new genetic information is particularly relevant as a reference for clinical purposes. Global-scale initiatives as the 1000 Genomes Project (1kG) already include Iberian population; however, no Portuguese individuals were included in this cohort. Furthermore, to our knowledge, gnomAD, the most extensive genomic dataset, does not include Portuguese individuals either. We believe that a Portuguese collection of genomic information would greatly benefit molecular diagnosis in Portuguese patients. Variants detected in 70 Portuguese individuals were inserted in a MongoDB No-SQL Database. The 1kG and gnomAD information for each variant were uploaded to the same database. Allele frequencies for seven gnomAD populations, five 1kG populations, and five 1kG European subpopulations were compared to the values calculated for our data. Allele distribution differences were tested with Fisher’s exact test. P-values were corrected for False Discovery Rate (FDR). The exomes of the Portuguese individuals contained 224,155 variants filtered accordingly to defined quality criteria. Approximately 16.4% of the variants had not been previously reported by 1kG or gnomAD projects. The present work endorsed the evidence for a correlation between genetic and geographic distance previously reported in the literature. Finally, significative differences were found for the allele distribution between our population and the other 1kG European subpopulations in 7,284 variants distributed by 2,571 genes. Results suggest the existence of populational genetic markers and may prompt future studies for detection of Portuguese-specific genetic markers. The present study is a significant contribution to enrich large-scale genomic initiatives and, to stand as a useful auxiliary reference for genetic analyses of Portuguese patients.Este trabalho foi efetuado no âmbito do projeto In2Genome, ref. CENTRO-01-0247-FEDER-017800, apoiado pelo Programa Operacional Regional do Centro de Portugal (CENTRO 2020), ao abrigo do Acordo de Parceria Portugal 2020, através do Comité Regional Europeu Fundo de Desenvolvimento (FEDER).Egas, ConceiçãoFroufe, HugoMendes, RuiUniversidade do MinhoMartins, Daniel Eduardo Fernandes2018-11-232018-11-23T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/79939eng203018052info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-12-09T01:20:47Zoai:repositorium.sdum.uminho.pt:1822/79939Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:34:30.543344Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Characterization of genetic variants in 70 portuguese individuals
title Characterization of genetic variants in 70 portuguese individuals
spellingShingle Characterization of genetic variants in 70 portuguese individuals
Martins, Daniel Eduardo Fernandes
Genómica
Alterações genéticas
Exomas
Distribuição alélica
População
Genomics
Variants
Exomes
Allele distribution
Population
Ciências Naturais::Outras Ciências Naturais
title_short Characterization of genetic variants in 70 portuguese individuals
title_full Characterization of genetic variants in 70 portuguese individuals
title_fullStr Characterization of genetic variants in 70 portuguese individuals
title_full_unstemmed Characterization of genetic variants in 70 portuguese individuals
title_sort Characterization of genetic variants in 70 portuguese individuals
author Martins, Daniel Eduardo Fernandes
author_facet Martins, Daniel Eduardo Fernandes
author_role author
dc.contributor.none.fl_str_mv Egas, Conceição
Froufe, Hugo
Mendes, Rui
Universidade do Minho
dc.contributor.author.fl_str_mv Martins, Daniel Eduardo Fernandes
dc.subject.por.fl_str_mv Genómica
Alterações genéticas
Exomas
Distribuição alélica
População
Genomics
Variants
Exomes
Allele distribution
Population
Ciências Naturais::Outras Ciências Naturais
topic Genómica
Alterações genéticas
Exomas
Distribuição alélica
População
Genomics
Variants
Exomes
Allele distribution
Population
Ciências Naturais::Outras Ciências Naturais
description Dissertação de mestrado em Bioinformática
publishDate 2018
dc.date.none.fl_str_mv 2018-11-23
2018-11-23T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/79939
url https://hdl.handle.net/1822/79939
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 203018052
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132866664202240