Análise in silico de sequências de DNA de regiões genômicas associadas ao sistema CRISPR

Detalhes bibliográficos
Autor(a) principal: Machado, Hellen Cristine
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: https://hdl.handle.net/1884/61899
Resumo: Orientador: Prof. Dr. Dieval Guizelini
id UFPR_84871722c8c9c317d5565ea960f8eb8d
oai_identifier_str oai:acervodigital.ufpr.br:1884/61899
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Machado, Hellen CristineUniversidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em BioinformáticaGuizelini, Dieval, 1976-2022-05-09T19:47:44Z2022-05-09T19:47:44Z2019https://hdl.handle.net/1884/61899Orientador: Prof. Dr. Dieval GuizeliniDissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa : Curitiba, 25/02/2019Inclui referências: p. 52-55Resumo: As repetições palindrômicas curtas, interespaçadas e regularmente agrupadas - CRISPR - formam um sistema de imunidade adquirida em bactérias e arqueas. O CRISPR é um dos sistemas mais estudados na última década, especialmente como ferramenta de edição gênica, devido à sua capacidade de gerar indels em sequências alvo. Entretanto, as características nucleotídicas da região, a origem das sequências estruturais básicas e sua relação com outras estruturas conhecidas ainda são pouco descritas. Por isso, aqui nós mostramos uma análise exploratória in silico de sequências genômicas de regiões CRISPR em procariotos. Sequências de regiões CRISPR foram obtidas de diferentes bases de dados e foram agrupadas com a ferramenta RAFTS³G com critério de 50% de identidade. Os clusters formados foram confrontados com bases de dados públicas para predição de funções e estruturas biológicas. Os resultados indicam relação entre as sequências de repetição direta (DR) e outras estruturas, e há evidências de transferência horizontal de genes entre os domínios Bacteria, Archaea e Eukarya. As 7.081 sequências DR de bactérias agrupadas constituem 1.547 clusters, que compartilham 50% de identidade. Os maiores clusters são compostos por 1.001 (14%) e 140 sequências (2%), porém há baixa diversidade intracluster visto que esses grupos apresentam 30 e 32 sequências distintas, respectivamente. Já a análise de predição funcional indica que há grande similaridade entre sequências DR e estruturas conhecidas, como RNAs e alguns MGEs. Alinhamentos de sequências indicam a transferência horizontal de arranjos CRISPR entre Bradyrhizobium sp. BTAi 1 e a espécie de trigo selvagem Triticum urartu. Já as sequências de espaçadores CRISPR produziram muitos agrupamentos, todos com poucos membros e baixa similaridade com os elementos genéticos móveis conhecidos, demonstrando que a origem dos espaçadores precisa ser esclarecida. Nosso estudo demonstra que os componentes principais do arranjo CRISPR - DR e espaçadores - estão relacionados com diferentes estruturas funcionais conhecidas. A abordagem desse trabalho produziu diversos grupos que precisam ainda ser analisados, no intuito de ampliar o conhecimento do arranjo CRISPR. Também, a origem das sequências DR e dos espaçadores não foi revelada; além disso, contrapondo o que é descrito na literatura, observamos que os genes Cas1 e Cas2 não são universais, e detectamos a presença de CRISPR em eucarioto, visto que até o momento a estrutura era descrita unicamente em procariotos. Palavras-chave: CRISPR. Sequências de Repetição Direta. Espaçadores. Agrupamento.Abstract: Clustered Regularly Interspaced Short Palindromic Repeats (CRISPR) systems form an acquired immunity system that are widespread in bacteria and archaea. CRISPR are one of largely studied systems in last decade, especially as genome editing tool due to its ability to generate indels in target sequences. However, nucleotide characteristics of this region, the origin of basic structural sequences and its relations with well-known structures are poorly described. Therefore, here we show an in silico exploratory analysis of genomic sequences of CRISPR regions in prokaryotes. CRISPR sequences were collected from different databases and clustered by RAFTS³G tool with 50% of identity. Resulting clusters were matched against public databases in order to predict biological functions and structures. Results indicate a relationship between direct repeat sequences (DR) and other structures, and we found evidences of horizontal gene transfer between the Bacteria, Archaea and Eukarya domains. The 7.081 clustered DR sequences formed 1.547 clusters, which share 50% identity. The largest clusters are composed by 1.001 (14%) and 140 sequences (2%), but have low intracluster diversity, with 30 and 32 distinct sequences, respectively. The functional prediction analysis suggests high similarity between DR sequences and well-known structures, such as RNAs and some MGEs. Sequence alignments indicate horizontal transfer of CRISPR arrays from Bradyrhizobium sp. BTAi 1 to the wild wheat specie Triticum urartu. CRISPR spacers sequences resulted in a large number of clusters, all with few members and low similarity to known mobile genetic elements, indicating that the origin of the spacers needs to be elucidated. This study demonstrates that the main components of CRISPR array - DR and spacers - are closely related with well-known functional structures. The approach used in this research produced several clusters that still need to be analyzed in order to increase CRISPR arrays understanding. In addition, the origin of DR and spacers sequences was not found out; furthermore, in contrast with the literature, we observed that the Cas1 and Cas2 genes are not universal, and we detected the presence of CRISPR in eukaryote, whereas the structure was described only in prokaryotes. Keywords: CRISPR. Direct Repeat Sequences. Spacers. Clustering.1 recurso online : PDF.application/pdfSeqüencia de nucleotidiosAlgorítmos genéticosBioinformáticaAnálise in silico de sequências de DNA de regiões genômicas associadas ao sistema CRISPRinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - HELLEN CRISTINE MACHADO.pdfapplication/pdf14509846https://acervodigital.ufpr.br/bitstream/1884/61899/1/R%20-%20D%20-%20HELLEN%20CRISTINE%20MACHADO.pdf1675cc8e7fdd1f4c769aaecb0e177695MD51open access1884/618992022-05-09 16:47:44.531open accessoai:acervodigital.ufpr.br:1884/61899Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082022-05-09T19:47:44Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Análise in silico de sequências de DNA de regiões genômicas associadas ao sistema CRISPR
title Análise in silico de sequências de DNA de regiões genômicas associadas ao sistema CRISPR
spellingShingle Análise in silico de sequências de DNA de regiões genômicas associadas ao sistema CRISPR
Machado, Hellen Cristine
Seqüencia de nucleotidios
Algorítmos genéticos
Bioinformática
title_short Análise in silico de sequências de DNA de regiões genômicas associadas ao sistema CRISPR
title_full Análise in silico de sequências de DNA de regiões genômicas associadas ao sistema CRISPR
title_fullStr Análise in silico de sequências de DNA de regiões genômicas associadas ao sistema CRISPR
title_full_unstemmed Análise in silico de sequências de DNA de regiões genômicas associadas ao sistema CRISPR
title_sort Análise in silico de sequências de DNA de regiões genômicas associadas ao sistema CRISPR
author Machado, Hellen Cristine
author_facet Machado, Hellen Cristine
author_role author
dc.contributor.other.pt_BR.fl_str_mv Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática
dc.contributor.author.fl_str_mv Machado, Hellen Cristine
dc.contributor.advisor1.fl_str_mv Guizelini, Dieval, 1976-
contributor_str_mv Guizelini, Dieval, 1976-
dc.subject.por.fl_str_mv Seqüencia de nucleotidios
Algorítmos genéticos
Bioinformática
topic Seqüencia de nucleotidios
Algorítmos genéticos
Bioinformática
description Orientador: Prof. Dr. Dieval Guizelini
publishDate 2019
dc.date.issued.fl_str_mv 2019
dc.date.accessioned.fl_str_mv 2022-05-09T19:47:44Z
dc.date.available.fl_str_mv 2022-05-09T19:47:44Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/61899
url https://hdl.handle.net/1884/61899
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 1 recurso online : PDF.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/61899/1/R%20-%20D%20-%20HELLEN%20CRISTINE%20MACHADO.pdf
bitstream.checksum.fl_str_mv 1675cc8e7fdd1f4c769aaecb0e177695
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1797699066800373760