Gene expression analysis platform (GEAP) : uma plataforma flexível e intuitiva para análise de transcriptoma

Detalhes bibliográficos
Autor(a) principal: Nunes, Itamar José Guimarães
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/197555
Resumo: Atualmente, diversas técnicas em biologia molecular estão disponíveis com o propósito de auxiliar na observação de processos biológicos. Dentre essas técnicas, estão as análises de transcriptoma, que possibilitam quantificar a expressão de praticamente todos os genes em uma amostra sob uma determinada condição. Ao analisar transcriptomas, e possível explorar um grande volume de informações sobre fenômenos biológicos, inclusive de diversas doenças. Felizmente, muitos dados de transcriptoma estão disponíveis no banco de dados do Gene Expression Omnibus (GEO). Porém, analisar estes dados não é uma tarefa simples, sendo necessário um software especıfico para o Kit experimental utilizado na análise ou, alternativamente, conhecimento na linguagem de programação R. Os softwares de transcriptoma costumam suportar apenas arquivos do próprio fabricante, e podem não oferecer opções flexíveis para manipular seus dados. Por outro lado, aprender uma linguagem de programação não e trivial, e mesmo usuários com maior experiência podem ter dificuldades ao lidar com vários formatos de arquivos do GEO, considerando as milhares de plataformas presentes. Além disso, diminuir os requisitos de informática nesse tipo de análise pode acelerar a eficiência de obter seus resultados. Neste sentido, o programa Gene Expression Analysis Console (GEAP) foi desenvolvido com o propósito de analisar transcriptomas de forma visual e intuitiva, tendo maior foco em dados de microarranjo. Através do GEAP, o usuário pode: (i) baixar dados de séries e amostras do GEO sabendo apenas seu código de serie (Geo Series, ou GSE) ou de amostra (Geo Sample, ou GSM), sejam estes dados brutos ou previamente tratados; (ii) ler arquivos de transcriptoma pertencentes a milhares de plataformas atualmente disponíveis; (iii) permitir a criação de seu próprio conjunto de dados customizado, sendo uma ferramenta eficaz para lidar com formatos de arquivo de tabela; (iv) preparar e tratar estatisticamente os dados com algoritmos documentados pela literatura; (v) verificar a qualidade dos dados de forma visual e detalhada através de diagramas representativos; (vi) comparar a diferença de expressão entre as amostras e automatizar este processo seguindo metodologias bem consolidadas; (vii) visualizar os resultados de expressão diferencial por meio de tabelas otimizadas e diferentes tipos de gráficos que respondem a interação do usuário; e (viii) filtrar e organizar os resultados de forma personalizada, permitindo encontrar genes significantes. Por fim, este software foi desenvolvido tentando reunir os melhores atributos dos programas de microarranjo e da programação em R, com a finalidade de que qualquer usuário possa ter fácil acesso a analises de expressão genica por transcriptoma, ao mesmo tempo permitindo uma forte flexibilidade de manipulação dos dados, que até então era alcançada apenas com o R.
id UFRGS-2_9d12a87d1e5b8cc7f0f20a3397965e87
oai_identifier_str oai:www.lume.ufrgs.br:10183/197555
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Nunes, Itamar José GuimarãesRecamonde-Mendoza, MarianaFeltes, Bruno César2019-08-01T02:30:09Z2018http://hdl.handle.net/10183/197555001095266Atualmente, diversas técnicas em biologia molecular estão disponíveis com o propósito de auxiliar na observação de processos biológicos. Dentre essas técnicas, estão as análises de transcriptoma, que possibilitam quantificar a expressão de praticamente todos os genes em uma amostra sob uma determinada condição. Ao analisar transcriptomas, e possível explorar um grande volume de informações sobre fenômenos biológicos, inclusive de diversas doenças. Felizmente, muitos dados de transcriptoma estão disponíveis no banco de dados do Gene Expression Omnibus (GEO). Porém, analisar estes dados não é uma tarefa simples, sendo necessário um software especıfico para o Kit experimental utilizado na análise ou, alternativamente, conhecimento na linguagem de programação R. Os softwares de transcriptoma costumam suportar apenas arquivos do próprio fabricante, e podem não oferecer opções flexíveis para manipular seus dados. Por outro lado, aprender uma linguagem de programação não e trivial, e mesmo usuários com maior experiência podem ter dificuldades ao lidar com vários formatos de arquivos do GEO, considerando as milhares de plataformas presentes. Além disso, diminuir os requisitos de informática nesse tipo de análise pode acelerar a eficiência de obter seus resultados. Neste sentido, o programa Gene Expression Analysis Console (GEAP) foi desenvolvido com o propósito de analisar transcriptomas de forma visual e intuitiva, tendo maior foco em dados de microarranjo. Através do GEAP, o usuário pode: (i) baixar dados de séries e amostras do GEO sabendo apenas seu código de serie (Geo Series, ou GSE) ou de amostra (Geo Sample, ou GSM), sejam estes dados brutos ou previamente tratados; (ii) ler arquivos de transcriptoma pertencentes a milhares de plataformas atualmente disponíveis; (iii) permitir a criação de seu próprio conjunto de dados customizado, sendo uma ferramenta eficaz para lidar com formatos de arquivo de tabela; (iv) preparar e tratar estatisticamente os dados com algoritmos documentados pela literatura; (v) verificar a qualidade dos dados de forma visual e detalhada através de diagramas representativos; (vi) comparar a diferença de expressão entre as amostras e automatizar este processo seguindo metodologias bem consolidadas; (vii) visualizar os resultados de expressão diferencial por meio de tabelas otimizadas e diferentes tipos de gráficos que respondem a interação do usuário; e (viii) filtrar e organizar os resultados de forma personalizada, permitindo encontrar genes significantes. Por fim, este software foi desenvolvido tentando reunir os melhores atributos dos programas de microarranjo e da programação em R, com a finalidade de que qualquer usuário possa ter fácil acesso a analises de expressão genica por transcriptoma, ao mesmo tempo permitindo uma forte flexibilidade de manipulação dos dados, que até então era alcançada apenas com o R.Currently, a number of procedures in molecular biology are available in order to help the exploring of biological processes. Among these procedures, there is the transcriptome analysis, which allows to measure gene expression of virtually all genes contained in a set of samples under one specific condition. Through transcriptomic analyses, a large volume of information concerning several biological phenomena can be explored, including numerous diseases. Fortunately, many transcriptomic data are currently available in Gene Expression Omnibus (GEO) database. However, analyzing these data is not a trivial task, since it needs specific software for the experimental kit used in analysis, or alternatively, mastering the knowledge of R programming language. Usually, the transcriptome analysis softwares only support files from their own manufacturer, and also can lack flexible options for manipulating data. On the other side, it is not trivial to learn a programming language, and even experienced users can undergo hardship when dealing with the variety of file formats from GEO if we take into account the thousands of available platforms. Moreover, decreasing informatics requirements can bring more efficiency in getting results from the analyses. In this sense, a new software named Gene Expression Analysis Console (GEAP) was developed in order to analysise transcriptomes in a visual and intuitive manner, mainly focusing on microarray data. By using GEAP, the user can: (i) download series and samples from GEO by only knowing the GSE/GSM code, both for RAW data or values previously treated by the author; (ii) read transcriptomic files from thousands of available platforms; (iii) allow creating your own custom microarray data set, being as an effective tool for datasets formatted as tables; (iv) prepare the data and perform statistic treatment of expression values with well-documented algorithms from literature; (v) visually check the quality of your data with details through representative diagrams; (vi) compare the expression difference between samples and automate this process with at least six comparison methods, in addition to five options of statistic parameters for results correction; (vii) view the differentially expressed results in optimized tables and up to four dynamic charts that respond to user interaction; and (viii) filter and order results with customizable options, helping to find relevant genes. Lastly, this software was developed with as an attempt of putting together the best attributes from microarray programs and from R programming. Its aim is that any user could easily access transcriptome analysis, at the same time providing enough flexibility for data manipulation, which until now only has been reached with R.application/pdfporGenesTranscriptomaGeneExpressionTranscriptomicsBioinformaticsGene expression analysis platform (GEAP) : uma plataforma flexível e intuitiva para análise de transcriptomainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de BiociênciasPorto Alegre, BR-RS2018Biotecnologiagraduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001095266.pdf.txt001095266.pdf.txtExtracted Texttext/plain237007http://www.lume.ufrgs.br/bitstream/10183/197555/2/001095266.pdf.txt4b5535450698fabcec1804c47c817391MD52ORIGINAL001095266.pdfTexto completoapplication/pdf3422900http://www.lume.ufrgs.br/bitstream/10183/197555/1/001095266.pdf79d6be851b879691cc7c9130593a53aaMD5110183/1975552021-08-18 04:33:10.846478oai:www.lume.ufrgs.br:10183/197555Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2021-08-18T07:33:10Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Gene expression analysis platform (GEAP) : uma plataforma flexível e intuitiva para análise de transcriptoma
title Gene expression analysis platform (GEAP) : uma plataforma flexível e intuitiva para análise de transcriptoma
spellingShingle Gene expression analysis platform (GEAP) : uma plataforma flexível e intuitiva para análise de transcriptoma
Nunes, Itamar José Guimarães
Genes
Transcriptoma
Gene
Expression
Transcriptomics
Bioinformatics
title_short Gene expression analysis platform (GEAP) : uma plataforma flexível e intuitiva para análise de transcriptoma
title_full Gene expression analysis platform (GEAP) : uma plataforma flexível e intuitiva para análise de transcriptoma
title_fullStr Gene expression analysis platform (GEAP) : uma plataforma flexível e intuitiva para análise de transcriptoma
title_full_unstemmed Gene expression analysis platform (GEAP) : uma plataforma flexível e intuitiva para análise de transcriptoma
title_sort Gene expression analysis platform (GEAP) : uma plataforma flexível e intuitiva para análise de transcriptoma
author Nunes, Itamar José Guimarães
author_facet Nunes, Itamar José Guimarães
author_role author
dc.contributor.author.fl_str_mv Nunes, Itamar José Guimarães
dc.contributor.advisor1.fl_str_mv Recamonde-Mendoza, Mariana
dc.contributor.advisor-co1.fl_str_mv Feltes, Bruno César
contributor_str_mv Recamonde-Mendoza, Mariana
Feltes, Bruno César
dc.subject.por.fl_str_mv Genes
Transcriptoma
topic Genes
Transcriptoma
Gene
Expression
Transcriptomics
Bioinformatics
dc.subject.eng.fl_str_mv Gene
Expression
Transcriptomics
Bioinformatics
description Atualmente, diversas técnicas em biologia molecular estão disponíveis com o propósito de auxiliar na observação de processos biológicos. Dentre essas técnicas, estão as análises de transcriptoma, que possibilitam quantificar a expressão de praticamente todos os genes em uma amostra sob uma determinada condição. Ao analisar transcriptomas, e possível explorar um grande volume de informações sobre fenômenos biológicos, inclusive de diversas doenças. Felizmente, muitos dados de transcriptoma estão disponíveis no banco de dados do Gene Expression Omnibus (GEO). Porém, analisar estes dados não é uma tarefa simples, sendo necessário um software especıfico para o Kit experimental utilizado na análise ou, alternativamente, conhecimento na linguagem de programação R. Os softwares de transcriptoma costumam suportar apenas arquivos do próprio fabricante, e podem não oferecer opções flexíveis para manipular seus dados. Por outro lado, aprender uma linguagem de programação não e trivial, e mesmo usuários com maior experiência podem ter dificuldades ao lidar com vários formatos de arquivos do GEO, considerando as milhares de plataformas presentes. Além disso, diminuir os requisitos de informática nesse tipo de análise pode acelerar a eficiência de obter seus resultados. Neste sentido, o programa Gene Expression Analysis Console (GEAP) foi desenvolvido com o propósito de analisar transcriptomas de forma visual e intuitiva, tendo maior foco em dados de microarranjo. Através do GEAP, o usuário pode: (i) baixar dados de séries e amostras do GEO sabendo apenas seu código de serie (Geo Series, ou GSE) ou de amostra (Geo Sample, ou GSM), sejam estes dados brutos ou previamente tratados; (ii) ler arquivos de transcriptoma pertencentes a milhares de plataformas atualmente disponíveis; (iii) permitir a criação de seu próprio conjunto de dados customizado, sendo uma ferramenta eficaz para lidar com formatos de arquivo de tabela; (iv) preparar e tratar estatisticamente os dados com algoritmos documentados pela literatura; (v) verificar a qualidade dos dados de forma visual e detalhada através de diagramas representativos; (vi) comparar a diferença de expressão entre as amostras e automatizar este processo seguindo metodologias bem consolidadas; (vii) visualizar os resultados de expressão diferencial por meio de tabelas otimizadas e diferentes tipos de gráficos que respondem a interação do usuário; e (viii) filtrar e organizar os resultados de forma personalizada, permitindo encontrar genes significantes. Por fim, este software foi desenvolvido tentando reunir os melhores atributos dos programas de microarranjo e da programação em R, com a finalidade de que qualquer usuário possa ter fácil acesso a analises de expressão genica por transcriptoma, ao mesmo tempo permitindo uma forte flexibilidade de manipulação dos dados, que até então era alcançada apenas com o R.
publishDate 2018
dc.date.issued.fl_str_mv 2018
dc.date.accessioned.fl_str_mv 2019-08-01T02:30:09Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/197555
dc.identifier.nrb.pt_BR.fl_str_mv 001095266
url http://hdl.handle.net/10183/197555
identifier_str_mv 001095266
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/197555/2/001095266.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/197555/1/001095266.pdf
bitstream.checksum.fl_str_mv 4b5535450698fabcec1804c47c817391
79d6be851b879691cc7c9130593a53aa
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224576988872704