Estrutura genomica de tres megabases de DNA genomico (shotugun) de Eucalyptus : conteudo nucleotidico, sequencias repetitivas e genes

Bibliographic Details
Main Author: Lourenço, Rodrigo Tristan
Publication Date: 2004
Format: Master thesis
Language: por
Source: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Download full: https://hdl.handle.net/20.500.12733/1597386
Summary: Orientadores: Gonçalo Amarante Guimarães Pereira, Dario Grattapaglia
id UNICAMP-30_70d86f1920ef4eeaa78b75ab4d4e1cb8
oai_identifier_str oai::307528
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Estrutura genomica de tres megabases de DNA genomico (shotugun) de Eucalyptus : conteudo nucleotidico, sequencias repetitivas e genesEucaliptoGenomasSequência de nucleotídeosOrientadores: Gonçalo Amarante Guimarães Pereira, Dario GrattapagliaDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de BiologiaResumo: Com o intuito de obter uma visão da estrutura e composição do genoma de Eucalyptus, sequenciou-se aleatoriamente cerca de 10.000 fragmentos de DNA genômico de Eucalyptus grandis obtidos por meio de seqüenciamento por fragmentação randômica de DNA (shotgun) de uma biblioteca genômica, totalizando mais de 3,0 Mb válidos (phred >=20), isto é, cerca de 0,5% do genoma (640 Mpb). Depois de selecionadas quanto ao tamanho e qualidade, estas seqüências foram analisadas em termos do seu conteúdo nucleotídico, presença de regiões repetitivas e número de genes. Para análise do conteúdo de bases guanidílicas e citidílicas (GC) e do conteúdo de seqüências repetitivas utilizou-se o programa RepeatMasker, o qual indicou que as 10 mil seqüências continham, em média, 40,15% de GC. Aproximadamente 1,4% das bases pertenciam a seqüências transponíveis, distribuídas em 310 elementos repetitivos interespersados, dentre os quais 299 eram retroelementos, principalmente LTRs (¿Long Terminal Repeats¿) e apenas 11 eram transposons. Também foram identificados 986 microssatélites e 1.636 seqüências de baixa complexidade. No total, cerca de 5,8% do genoma de Eucalyptus é composto por seqüências repetitivas. Para a identificação de genes putativos presentes, utilizou-se uma estratégia alternativa baseada na comparação deste banco genômico com bancos de ESTs (¿Expressed Sequence Tags¿) de Eucalyptus utilizando o programa GenESTate, nomeando os genes identificados de acordo com o resultado do ¿BLAST¿ (¿Basic Local Alignment Search Tool¿) encontrado para as ESTs. Também comparou-se todas as seqüências genômicas com o banco de dados não-redundante de proteínas do NCBI (¿National Center for Biotechnology Information¿) com o intuito de identificar outros genes. Aproximadamente 44 seqüências similares a ESTs foram identificadas, contabilizando 2% do total de pares de bases analisado. É importante ressaltar a identificação de íntrons e éxons, além de regiões promotoras, a partir desta comparação, visto que estas estruturas não podem ser identificadas em ESTs. Cerca de 166 genes foram identificados a partir da comparação de todas as seqüências com o banco de dados de proteínas do NCBI por meio do protocolo ¿blastx-nr¿. Também foram identificados genes putativos para 16 tRNAs utilizando o programa tRNAscan-SE. Este banco de dados genômicos poderá ser utilizado no âmbito do Projeto Genolytpus para guiar o processo de ancoragem do mapa genético com o mapa físico, no desenvolvimento de novos marcadores do tipo microssatélites e na identificação de regiões promotorasAbstract: In this work we intended to obtain an overview of the structure and composition of the Eucalyptus genome by sample sequencing 10.000 genomic DNA fragments obtained from a shotgun genomic library from E. grandis, that represents 3,0 Mbp of the E. grandis genome. The reads were filtered by their quality and length (phred value >=20; length >=150) and analyzed for their nucleotide content, repetitive patterns, repetitive elements and gene content. The program RepeatMasker was used to analyze the %GC content and repetitive patterns and elements. The results indicate that on average the Eucalyptus genome is composed of 40.15% of GC. From the total of the bases sequenced approximately 1.4% were located in transposons, distributed in 310 interespersed repetitive genetic elements, among which 299 classified as retroelements, mainly LTRs. We also identified 986 microsatellites and 1636 low complexity sequences. 5.8% of the sequenced bases were located on repetitive sequences. We used an alternative approach to identify putative genes by comparing the genomic sequences with a Eucalyptus ESTs database using the GenESTate software. We attributed putative functions using a pipeline were the éxons of each gene were put togheter and compared with protein domains data banks. This procedure avoids the misleading results obtained when comparing DNA sequences with sequences deposited in GenBank. The sequences were clustered using the CAP3 software, resulting in 766 agrupamentos contíguos and 5428 singletos, the former showing an average of 1200 bp. These 766 agrupamentos contíguos were compared with more than 5,000 E. grandis ESTs from mature leaf tissue and 6,000 E. urophylla ESTs from xylem. From the 766 agrupamentos contíguos we found 44 that showed high similarity to some ESTs. The coding portion of the sequences accounted for around 2% of the total sequences. It is important to highlight that by this approach it was possible to identify íntrons and éxons, beside core promoter regions, which can¿t be identified in the ESTs. Other 166 possible genes were identified among the genomic sequences by using blastx-nr in NCBI. We also identified putative genes responsible for 16 tRNAs using the tRNAscan-SE software. These sequences are being used in the Genolyptus Project for the development of novel randomly distributed microsatellites markers, for the identification of promoter regions and will be used to assist in the development of overgo-probes to be applied in the anchoring of the genetic map to the physical maMestradoGenética de MicroorganismosMestre em Genética e Biologia Molecular[s.n.]Pereira, Gonçalo Amarante Guimarães, 1964-Grattapaglia, DarioUniversidade Estadual de Campinas. Instituto de BiologiaPrograma de Pós-Graduação não informadoUNIVERSIDADE ESTADUAL DE CAMPINASLourenço, Rodrigo Tristan20042004-02-16T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/20.500.12733/1597386LOURENÇO, Rodrigo Tristan. Estrutura genomica de tres megabases de DNA genomico (shotugun) de Eucalyptus: conteudo nucleotidico, sequencias repetitivas e genes. 2004. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1597386. Acesso em: 14 mai. 2024.https://repositorio.unicamp.br/acervo/detalhe/307528porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2016-12-15T14:11:02Zoai::307528Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2016-12-15T14:11:02Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Estrutura genomica de tres megabases de DNA genomico (shotugun) de Eucalyptus : conteudo nucleotidico, sequencias repetitivas e genes
title Estrutura genomica de tres megabases de DNA genomico (shotugun) de Eucalyptus : conteudo nucleotidico, sequencias repetitivas e genes
spellingShingle Estrutura genomica de tres megabases de DNA genomico (shotugun) de Eucalyptus : conteudo nucleotidico, sequencias repetitivas e genes
Lourenço, Rodrigo Tristan
Eucalipto
Genomas
Sequência de nucleotídeos
title_short Estrutura genomica de tres megabases de DNA genomico (shotugun) de Eucalyptus : conteudo nucleotidico, sequencias repetitivas e genes
title_full Estrutura genomica de tres megabases de DNA genomico (shotugun) de Eucalyptus : conteudo nucleotidico, sequencias repetitivas e genes
title_fullStr Estrutura genomica de tres megabases de DNA genomico (shotugun) de Eucalyptus : conteudo nucleotidico, sequencias repetitivas e genes
title_full_unstemmed Estrutura genomica de tres megabases de DNA genomico (shotugun) de Eucalyptus : conteudo nucleotidico, sequencias repetitivas e genes
title_sort Estrutura genomica de tres megabases de DNA genomico (shotugun) de Eucalyptus : conteudo nucleotidico, sequencias repetitivas e genes
author Lourenço, Rodrigo Tristan
author_facet Lourenço, Rodrigo Tristan
author_role author
dc.contributor.none.fl_str_mv Pereira, Gonçalo Amarante Guimarães, 1964-
Grattapaglia, Dario
Universidade Estadual de Campinas. Instituto de Biologia
Programa de Pós-Graduação não informado
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Lourenço, Rodrigo Tristan
dc.subject.por.fl_str_mv Eucalipto
Genomas
Sequência de nucleotídeos
topic Eucalipto
Genomas
Sequência de nucleotídeos
description Orientadores: Gonçalo Amarante Guimarães Pereira, Dario Grattapaglia
publishDate 2004
dc.date.none.fl_str_mv 2004
2004-02-16T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1597386
LOURENÇO, Rodrigo Tristan. Estrutura genomica de tres megabases de DNA genomico (shotugun) de Eucalyptus: conteudo nucleotidico, sequencias repetitivas e genes. 2004. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1597386. Acesso em: 14 mai. 2024.
url https://hdl.handle.net/20.500.12733/1597386
identifier_str_mv LOURENÇO, Rodrigo Tristan. Estrutura genomica de tres megabases de DNA genomico (shotugun) de Eucalyptus: conteudo nucleotidico, sequencias repetitivas e genes. 2004. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1597386. Acesso em: 14 mai. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/307528
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1799138388905820160