Desenvolvimento de Ferramenta Computacional para intergração de transcriptomas e redes biológicas: medidas de desempenho global

Detalhes bibliográficos
Autor(a) principal: Biazotti, Alex Augusto
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/152771
Resumo: A cada dia surgem novas tecnologias que possibilitam o estudo em larga escala dos RNAs transcritos por um organismo em condições especı́ficas, com isso fornecendo uma grande quantidade de informações. No entanto as metodologias tradicionais não são capazes de análisar de forma eficiente esses dados por utilizar cut-offs pré-definidos, eliminando assim uma grande quan- tidade de genes não considerados diferencialmente expresso, e por consequência reduzindo a precisão e a acurácia do estudo. Esse trabalho propõe o aperfeiçoamento da metodologia do transcriptograma (modelo cruz), desenvolvido por Rybarczyk-Filho et al., que realiza uma análise de forma global de um organismo, utilizando por sua vez redes proteı́cas e processos biológicos. Dentre as modificações realizadas estão: mudança no algoritmo de ordenamento para a redução do tempo de processamento da rede, adição de dois novos modelos “X” e “Anel”, a automação dos processos de análise de dados de expressão gênica, enriquecimento funcio- nal e da compilação de todas as informações em um gráfico. Para testar o aperfeiçoamento foram utilizadas duas séries de dados de expressão gênica, a GSE10072 e a GSE19804, re- ferentes a amostras de câncer de pulmão. O modelo “Anel” apresentou a melhor redução do custo energético de uma matriz, aproximadamente 93%. Para a modularidade, o modelo “Anel” também teve o melhor desempenho. A automação dos processos de enriquecimento funcional, da análise dos dados de expressão e da compilação de todos os dados em forma gráfica diminui o tempo gasto para a aquisição e geração, além de aumentar a acurácia. Os resultados indicam que independentemente do hábito ou nacionalidade de um indivı́duo, um mesmo tipo de câncer podem apresentar os mesmos conjuntos de processos biológicos alterados. A ferramenta não encontrou os mesmos processos biológicos indicados pelos software PAGE e GAGE, porém ele retornou processos mães ou filhos dos mesmos. A utilização desta ferramenta pode ser uma nova alternativa comparado aos demais métodos, devido a utilização de diversas informações adicionais ao conjunto de expressão gênica a ser analisado.
id UNSP_c1cb62621f028c7af2f569586ece9e03
oai_identifier_str oai:repositorio.unesp.br:11449/152771
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Desenvolvimento de Ferramenta Computacional para intergração de transcriptomas e redes biológicas: medidas de desempenho globalDevelopment of a Computational Tool for integration of transcriptomes and biological networks: measures of overall performanceIntegração de dadosMicroarranjoOntologiaRede proteicaTranscriptogramaA cada dia surgem novas tecnologias que possibilitam o estudo em larga escala dos RNAs transcritos por um organismo em condições especı́ficas, com isso fornecendo uma grande quantidade de informações. No entanto as metodologias tradicionais não são capazes de análisar de forma eficiente esses dados por utilizar cut-offs pré-definidos, eliminando assim uma grande quan- tidade de genes não considerados diferencialmente expresso, e por consequência reduzindo a precisão e a acurácia do estudo. Esse trabalho propõe o aperfeiçoamento da metodologia do transcriptograma (modelo cruz), desenvolvido por Rybarczyk-Filho et al., que realiza uma análise de forma global de um organismo, utilizando por sua vez redes proteı́cas e processos biológicos. Dentre as modificações realizadas estão: mudança no algoritmo de ordenamento para a redução do tempo de processamento da rede, adição de dois novos modelos “X” e “Anel”, a automação dos processos de análise de dados de expressão gênica, enriquecimento funcio- nal e da compilação de todas as informações em um gráfico. Para testar o aperfeiçoamento foram utilizadas duas séries de dados de expressão gênica, a GSE10072 e a GSE19804, re- ferentes a amostras de câncer de pulmão. O modelo “Anel” apresentou a melhor redução do custo energético de uma matriz, aproximadamente 93%. Para a modularidade, o modelo “Anel” também teve o melhor desempenho. A automação dos processos de enriquecimento funcional, da análise dos dados de expressão e da compilação de todos os dados em forma gráfica diminui o tempo gasto para a aquisição e geração, além de aumentar a acurácia. Os resultados indicam que independentemente do hábito ou nacionalidade de um indivı́duo, um mesmo tipo de câncer podem apresentar os mesmos conjuntos de processos biológicos alterados. A ferramenta não encontrou os mesmos processos biológicos indicados pelos software PAGE e GAGE, porém ele retornou processos mães ou filhos dos mesmos. A utilização desta ferramenta pode ser uma nova alternativa comparado aos demais métodos, devido a utilização de diversas informações adicionais ao conjunto de expressão gênica a ser analisado.Every day, new technologies are emerging that make it possible the large-scale study of RNAs transcribed by an organism under specific conditions, providing a huge amount of information. However, the traditional methodologies are not able to efficiently analyze these data due the use of pre-defined cut-offs, thus eliminating a large number of genes not considered differentially expressed, and consequently reducing precision andaccuracy of the study. This work proposes the improvement of the methodology of the Transcriptogram (model “Cross”), developed by Rybarczyk-Filho et al., which performs an overall analysis of an organism, using protein networks and biological processes. Among the modifications made are: Modification in ordering algorithm to reduce the network processing time, addition of the two new “X” and “Ring” models, the automation of the processes of gene expression data analysis, functional enrichment and the compilation of all information in a graphic. To test the improvements, two sets of gene expression data were used, GSE10072 and GSE19804, corresponding to samples of lung cancer. The “Ring” model showed the best matrix energy cost reduction, approximately 93%. For modularity, the “Ring” model also had the best performance. The automation of functional enrichment processes, the analysis of expression data and the compilation of all data in a graphic form reduces the time spent for acquisition and generation, increasing the accuracy. The results indicate that regardless of habit of an individual, the same type of cancer may present the same sets of altered biological processes. The tool did not find the same biological processes indicated by the software PAGE and GAGE, but it returned their ancestor or child processes. The use of this tool may be a new alternative to the other methods, due the use of additional information to the set of gene expression to be analyzed.Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)CNPq: 458810/2013-4CNPq: 473789/2013-2Universidade Estadual Paulista (Unesp)Rybarczyk Filho, José Luiz [UNESP]Takeda, Agnes Alessandra Sekijima [UNESP]Universidade Estadual Paulista (Unesp)Biazotti, Alex Augusto2018-02-20T16:14:39Z2018-02-20T16:14:39Z2017-02-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfhttp://hdl.handle.net/11449/15277100089721233004064087P8porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-11-01T06:13:43Zoai:repositorio.unesp.br:11449/152771Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462023-11-01T06:13:43Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Desenvolvimento de Ferramenta Computacional para intergração de transcriptomas e redes biológicas: medidas de desempenho global
Development of a Computational Tool for integration of transcriptomes and biological networks: measures of overall performance
title Desenvolvimento de Ferramenta Computacional para intergração de transcriptomas e redes biológicas: medidas de desempenho global
spellingShingle Desenvolvimento de Ferramenta Computacional para intergração de transcriptomas e redes biológicas: medidas de desempenho global
Biazotti, Alex Augusto
Integração de dados
Microarranjo
Ontologia
Rede proteica
Transcriptograma
title_short Desenvolvimento de Ferramenta Computacional para intergração de transcriptomas e redes biológicas: medidas de desempenho global
title_full Desenvolvimento de Ferramenta Computacional para intergração de transcriptomas e redes biológicas: medidas de desempenho global
title_fullStr Desenvolvimento de Ferramenta Computacional para intergração de transcriptomas e redes biológicas: medidas de desempenho global
title_full_unstemmed Desenvolvimento de Ferramenta Computacional para intergração de transcriptomas e redes biológicas: medidas de desempenho global
title_sort Desenvolvimento de Ferramenta Computacional para intergração de transcriptomas e redes biológicas: medidas de desempenho global
author Biazotti, Alex Augusto
author_facet Biazotti, Alex Augusto
author_role author
dc.contributor.none.fl_str_mv Rybarczyk Filho, José Luiz [UNESP]
Takeda, Agnes Alessandra Sekijima [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Biazotti, Alex Augusto
dc.subject.por.fl_str_mv Integração de dados
Microarranjo
Ontologia
Rede proteica
Transcriptograma
topic Integração de dados
Microarranjo
Ontologia
Rede proteica
Transcriptograma
description A cada dia surgem novas tecnologias que possibilitam o estudo em larga escala dos RNAs transcritos por um organismo em condições especı́ficas, com isso fornecendo uma grande quantidade de informações. No entanto as metodologias tradicionais não são capazes de análisar de forma eficiente esses dados por utilizar cut-offs pré-definidos, eliminando assim uma grande quan- tidade de genes não considerados diferencialmente expresso, e por consequência reduzindo a precisão e a acurácia do estudo. Esse trabalho propõe o aperfeiçoamento da metodologia do transcriptograma (modelo cruz), desenvolvido por Rybarczyk-Filho et al., que realiza uma análise de forma global de um organismo, utilizando por sua vez redes proteı́cas e processos biológicos. Dentre as modificações realizadas estão: mudança no algoritmo de ordenamento para a redução do tempo de processamento da rede, adição de dois novos modelos “X” e “Anel”, a automação dos processos de análise de dados de expressão gênica, enriquecimento funcio- nal e da compilação de todas as informações em um gráfico. Para testar o aperfeiçoamento foram utilizadas duas séries de dados de expressão gênica, a GSE10072 e a GSE19804, re- ferentes a amostras de câncer de pulmão. O modelo “Anel” apresentou a melhor redução do custo energético de uma matriz, aproximadamente 93%. Para a modularidade, o modelo “Anel” também teve o melhor desempenho. A automação dos processos de enriquecimento funcional, da análise dos dados de expressão e da compilação de todos os dados em forma gráfica diminui o tempo gasto para a aquisição e geração, além de aumentar a acurácia. Os resultados indicam que independentemente do hábito ou nacionalidade de um indivı́duo, um mesmo tipo de câncer podem apresentar os mesmos conjuntos de processos biológicos alterados. A ferramenta não encontrou os mesmos processos biológicos indicados pelos software PAGE e GAGE, porém ele retornou processos mães ou filhos dos mesmos. A utilização desta ferramenta pode ser uma nova alternativa comparado aos demais métodos, devido a utilização de diversas informações adicionais ao conjunto de expressão gênica a ser analisado.
publishDate 2017
dc.date.none.fl_str_mv 2017-02-17
2018-02-20T16:14:39Z
2018-02-20T16:14:39Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/152771
000897212
33004064087P8
url http://hdl.handle.net/11449/152771
identifier_str_mv 000897212
33004064087P8
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1803649590658859008