Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos

Detalhes bibliográficos
Autor(a) principal: Brito, Danilo Ribeiro de
Data de Publicação: 2024
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UEL
Texto Completo: https://repositorio.uel.br/handle/123456789/10075
Resumo: Resumo: O café encontra-se entre as principais commodities agrícolas do Brasil, o qual ocupa o posto de maior produtor e exportador de café no mundo Dentre as 124 espécies do gênero, Coffea arabica, Coffea canefora e Coffea eugenioides são as de maior destaque e as duas primeiras representam a maior parte da produção de café Com exceção do C arabica, todas as demais espécies do gênero são diplóides C arabica é um alotetraplóide, formado a partir de uma hibridação natural entre C canephora e C eugenioides O parental C eugenioides ainda foi pouco estudado, porém muitas características genéticas dos cafés Árabicas comerciais foram herdadas desta espécie Desta forma, é justifica-se aumentar o conhecimento sobre os genes funcionalmente ativos no transcriptoma de C eugenioides A tecnologia de sequenciamento de RNAs (RNA-Seq) tem sido muito utilizada em trabalhos de identificação e anotação funcional de genes para diversas espécies de plantas, assim como para verificar os níveis de atividade transcricional e identificação de genes diferencialmente expressos em determinadas condições e/ou tecidos específicos O presente projeto teve como objetivo realizar a montagem, anotação funcional dos transcritos de folhas e frutos de C eugenioides utilizando o seu genoma como referência para o alinhamento das sequências, e comparar os resultados obtidos com os disponíveis até o presente momento em bancos de dados públicos Foram utilizadas duas bibliotecas de RNA-Seq (folhas e frutos) de C eugenioides sequenciadas via plataforma Illumina Hiseq2 Primeiramente foi realizado o alinhamento das bibliotecas contra o genoma de referência utilizando o software HISAT2 Para montagem dos reads alinhado em transcritos foi utilizado o software StringTie e na sequência o software Kallisto para a quantificação dos transcritos O software DESeq2 foi utilizado para identificação de genes diferencialmente expressos em frutos e folhas Para anotação utilizamos o BlastX contra o banco de dados de sequências não redundantes (NCBI-nr) Foi realizada uma análise comparativa com a ferramenta BlastN contra o banco de dados de sequências expressas (EST) de C arabica e C canephora pré-existentes O resultado da montagem de transcritos identificou 16743 contigs únicos para C eugenioides, estas sequências apresentaram similaridade de 82,6% com ESTs de C arabica, 91,38% em CDS de C canephora, 94,87% com o RNA-Seq de C arabica e 98,7% com o RNA-Seq de C eugenioides Em relação ao trabalho original, foram identificados 322 novos transcritos, das quais 36 não foram descritos nas bases de dados da Coffea spp Além disso, foram identificados 923 genes diferencialmente expressos em folhas e frutos, sendo 414 mais expressos em folhas e 59 mais expressos em frutos Seis genes diferencialmente expressos em frutos tiveram sua atividade confirmada por RT-qPCR Três deles tiveram expressão exclusiva em frutos, apresentando potencial biotecnológico para a produção de compostos específicos ou para identificação e análise de promotores
id UEL_53e441a3b2936b4dbb7797abebb4f1bc
oai_identifier_str oai:repositorio.uel.br:123456789/10075
network_acronym_str UEL
network_name_str Repositório Institucional da UEL
repository_id_str
spelling Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutosCaféSequência de nucleotídeosGenesCoffeeNucleotide sequenceGenesResumo: O café encontra-se entre as principais commodities agrícolas do Brasil, o qual ocupa o posto de maior produtor e exportador de café no mundo Dentre as 124 espécies do gênero, Coffea arabica, Coffea canefora e Coffea eugenioides são as de maior destaque e as duas primeiras representam a maior parte da produção de café Com exceção do C arabica, todas as demais espécies do gênero são diplóides C arabica é um alotetraplóide, formado a partir de uma hibridação natural entre C canephora e C eugenioides O parental C eugenioides ainda foi pouco estudado, porém muitas características genéticas dos cafés Árabicas comerciais foram herdadas desta espécie Desta forma, é justifica-se aumentar o conhecimento sobre os genes funcionalmente ativos no transcriptoma de C eugenioides A tecnologia de sequenciamento de RNAs (RNA-Seq) tem sido muito utilizada em trabalhos de identificação e anotação funcional de genes para diversas espécies de plantas, assim como para verificar os níveis de atividade transcricional e identificação de genes diferencialmente expressos em determinadas condições e/ou tecidos específicos O presente projeto teve como objetivo realizar a montagem, anotação funcional dos transcritos de folhas e frutos de C eugenioides utilizando o seu genoma como referência para o alinhamento das sequências, e comparar os resultados obtidos com os disponíveis até o presente momento em bancos de dados públicos Foram utilizadas duas bibliotecas de RNA-Seq (folhas e frutos) de C eugenioides sequenciadas via plataforma Illumina Hiseq2 Primeiramente foi realizado o alinhamento das bibliotecas contra o genoma de referência utilizando o software HISAT2 Para montagem dos reads alinhado em transcritos foi utilizado o software StringTie e na sequência o software Kallisto para a quantificação dos transcritos O software DESeq2 foi utilizado para identificação de genes diferencialmente expressos em frutos e folhas Para anotação utilizamos o BlastX contra o banco de dados de sequências não redundantes (NCBI-nr) Foi realizada uma análise comparativa com a ferramenta BlastN contra o banco de dados de sequências expressas (EST) de C arabica e C canephora pré-existentes O resultado da montagem de transcritos identificou 16743 contigs únicos para C eugenioides, estas sequências apresentaram similaridade de 82,6% com ESTs de C arabica, 91,38% em CDS de C canephora, 94,87% com o RNA-Seq de C arabica e 98,7% com o RNA-Seq de C eugenioides Em relação ao trabalho original, foram identificados 322 novos transcritos, das quais 36 não foram descritos nas bases de dados da Coffea spp Além disso, foram identificados 923 genes diferencialmente expressos em folhas e frutos, sendo 414 mais expressos em folhas e 59 mais expressos em frutos Seis genes diferencialmente expressos em frutos tiveram sua atividade confirmada por RT-qPCR Três deles tiveram expressão exclusiva em frutos, apresentando potencial biotecnológico para a produção de compostos específicos ou para identificação e análise de promotoresDissertação (Mestrado em Genética e Biologia Molecular) - Universidade Estadual de Londrina, Centro de Ciências Biológicas, Programa de Pós-Graduação em Genética e Biologia MolecularAbstract: Coffee is one of the main agricultural commodities in Brazil, the largest producer and exporter of coffee worldwide Among 124 coffee species, Coffea arabica, Coffea canephora and Coffea eugenioides are the most important and the first two represent the major part of coffee production With the exception of C arabica, all other species of the genus are diploid C arabica is an alotetraploid, formed from a natural hybridization between C canephora and C eugenioides The parental C eugenioides is still poorly studied, but many genetic characteristics of commercial Arabica coffees are inherited from this species Thus, it is important to increase knowledge about the functionally active genes in the transcriptome of C eugenioides Sequencing of RNAs (RNA-Seq) has been widely used in the identification and functional annotation of genes for several plant species, as well as to verify the levels of transcriptional activity and identification of genes differentially expressed under certain conditions and / or specific tissues The present project had the objective of to assembe and perform functional annotation of the transcriptome genes of leaves and fruits of C eugenioides using its genome as a reference for sequences alignment Also to compare our results with the public data banks available Two sequential RNA-Seq (leaf and fruit) libraries of C eugenioides were used via the Illumina Hiseq2 platform First, the alignment of the libraries against the reference genome was performed using the HISAT2 software For assembly of the transcripts, the software StringTie was used and in sequence the Kallisto software for the quantification of the transcripts DESeq2 was used to identify genes differentially expressed in fruits and leaves For annotation we used BlastX against the non-redundant sequence database (NCBI-nr) A comparative analysis was performed with the BlastN tool against the preexisting C arabica and C canephora Expressed Sequence Database (EST) The result of the assembly of transcripts identified 16,743 unique contigs for the species, these sequences presented similarity of 826% with ESTs of C arabica, 9138% in CDS of C canephora, 9487% with RNA-Seq of C arabica and 987% with C eugenioides RNA-Seq In relation to the original work, 322 new transcripts were identified, 36 of which were not described in the Coffea spp databases In addition, 923 differentially expressed genes in leaves and fruits were identified, 414 being more expressed in leaves and 59 being more expressed in fruits Six differentially expressed genes in fruits had their activity confirmed by RT-qPCR Three of these had exclusive expression in fruits, presenting biotechnological potential for the production of specific compounds or for identification and analysis of promotersRuas, Paulo Maurício [Orientador]Ivamoto, Suzana TiemiSouza, Rogério Fernandes dePereira, Luiz Filipe Protasio [Coorientador]Brito, Danilo Ribeiro de2024-05-01T12:14:01Z2024-05-01T12:14:01Z2019.0022.02.2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://repositorio.uel.br/handle/123456789/10075porMestradoGenética e Biologia MolecularCentro de Ciências BiológicasPrograma de Pós-graduação em Genética e Biologia MolecularCentro Nacional de Pesquisa de Soja (Brasil)Londrinareponame:Repositório Institucional da UELinstname:Universidade Estadual de Londrina (UEL)instacron:UELinfo:eu-repo/semantics/openAccess2024-07-12T04:20:06Zoai:repositorio.uel.br:123456789/10075Biblioteca Digital de Teses e Dissertaçõeshttp://www.bibliotecadigital.uel.br/PUBhttp://www.bibliotecadigital.uel.br/OAI/oai2.phpbcuel@uel.br||opendoar:2024-07-12T04:20:06Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)false
dc.title.none.fl_str_mv Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
title Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
spellingShingle Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
Brito, Danilo Ribeiro de
Café
Sequência de nucleotídeos
Genes
Coffee
Nucleotide sequence
Genes
title_short Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
title_full Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
title_fullStr Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
title_full_unstemmed Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
title_sort Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
author Brito, Danilo Ribeiro de
author_facet Brito, Danilo Ribeiro de
author_role author
dc.contributor.none.fl_str_mv Ruas, Paulo Maurício [Orientador]
Ivamoto, Suzana Tiemi
Souza, Rogério Fernandes de
Pereira, Luiz Filipe Protasio [Coorientador]
dc.contributor.author.fl_str_mv Brito, Danilo Ribeiro de
dc.subject.por.fl_str_mv Café
Sequência de nucleotídeos
Genes
Coffee
Nucleotide sequence
Genes
topic Café
Sequência de nucleotídeos
Genes
Coffee
Nucleotide sequence
Genes
description Resumo: O café encontra-se entre as principais commodities agrícolas do Brasil, o qual ocupa o posto de maior produtor e exportador de café no mundo Dentre as 124 espécies do gênero, Coffea arabica, Coffea canefora e Coffea eugenioides são as de maior destaque e as duas primeiras representam a maior parte da produção de café Com exceção do C arabica, todas as demais espécies do gênero são diplóides C arabica é um alotetraplóide, formado a partir de uma hibridação natural entre C canephora e C eugenioides O parental C eugenioides ainda foi pouco estudado, porém muitas características genéticas dos cafés Árabicas comerciais foram herdadas desta espécie Desta forma, é justifica-se aumentar o conhecimento sobre os genes funcionalmente ativos no transcriptoma de C eugenioides A tecnologia de sequenciamento de RNAs (RNA-Seq) tem sido muito utilizada em trabalhos de identificação e anotação funcional de genes para diversas espécies de plantas, assim como para verificar os níveis de atividade transcricional e identificação de genes diferencialmente expressos em determinadas condições e/ou tecidos específicos O presente projeto teve como objetivo realizar a montagem, anotação funcional dos transcritos de folhas e frutos de C eugenioides utilizando o seu genoma como referência para o alinhamento das sequências, e comparar os resultados obtidos com os disponíveis até o presente momento em bancos de dados públicos Foram utilizadas duas bibliotecas de RNA-Seq (folhas e frutos) de C eugenioides sequenciadas via plataforma Illumina Hiseq2 Primeiramente foi realizado o alinhamento das bibliotecas contra o genoma de referência utilizando o software HISAT2 Para montagem dos reads alinhado em transcritos foi utilizado o software StringTie e na sequência o software Kallisto para a quantificação dos transcritos O software DESeq2 foi utilizado para identificação de genes diferencialmente expressos em frutos e folhas Para anotação utilizamos o BlastX contra o banco de dados de sequências não redundantes (NCBI-nr) Foi realizada uma análise comparativa com a ferramenta BlastN contra o banco de dados de sequências expressas (EST) de C arabica e C canephora pré-existentes O resultado da montagem de transcritos identificou 16743 contigs únicos para C eugenioides, estas sequências apresentaram similaridade de 82,6% com ESTs de C arabica, 91,38% em CDS de C canephora, 94,87% com o RNA-Seq de C arabica e 98,7% com o RNA-Seq de C eugenioides Em relação ao trabalho original, foram identificados 322 novos transcritos, das quais 36 não foram descritos nas bases de dados da Coffea spp Além disso, foram identificados 923 genes diferencialmente expressos em folhas e frutos, sendo 414 mais expressos em folhas e 59 mais expressos em frutos Seis genes diferencialmente expressos em frutos tiveram sua atividade confirmada por RT-qPCR Três deles tiveram expressão exclusiva em frutos, apresentando potencial biotecnológico para a produção de compostos específicos ou para identificação e análise de promotores
publishDate 2024
dc.date.none.fl_str_mv 2019.00
2024-05-01T12:14:01Z
2024-05-01T12:14:01Z
22.02.2019
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.uel.br/handle/123456789/10075
url https://repositorio.uel.br/handle/123456789/10075
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv Mestrado
Genética e Biologia Molecular
Centro de Ciências Biológicas
Programa de Pós-graduação em Genética e Biologia Molecular
Centro Nacional de Pesquisa de Soja (Brasil)
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv Londrina
dc.source.none.fl_str_mv reponame:Repositório Institucional da UEL
instname:Universidade Estadual de Londrina (UEL)
instacron:UEL
instname_str Universidade Estadual de Londrina (UEL)
instacron_str UEL
institution UEL
reponame_str Repositório Institucional da UEL
collection Repositório Institucional da UEL
repository.name.fl_str_mv Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)
repository.mail.fl_str_mv bcuel@uel.br||
_version_ 1809823283601735680