Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas

Detalhes bibliográficos
Autor(a) principal: Notari, Daniel Luís
Data de Publicação: 2012
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UCS
Texto Completo: https://repositorio.ucs.br/handle/11338/694
Resumo: Workflows científicos são projetados para realizar experimentos in silico com o intuito de processar e analisar uma grande quantidade de dados usando simulação computacional. Os experimentos são organizados como uma sequência de etapas que caracterizam um fluxo de execução, onde em cada etapa utilizam-se diferentes softwares. Estes softwares não possuem um modelo de representação de dados comum. Por isto, quando um workflow científico é construído com o objetivo de integrar e processar dados, cada etapa precisa analisar a estrutura dos dados, processá-los e preparar os mesmos de acordo com a estrutura necessária para a execução da próxima etapa do workflow. Desta maneira, os workflows científicos usam diferentes algoritmos provenientes das áreas da matemática e da ciência da computação, os quais são capazes de processar, armazenar e transformar os dados utilizados em informação útil para diferentes análises de pesquisadores de biologia. Adicionalmente, a biologia de sistemas é uma subárea da bioinformática que ajuda a compreender as interações observadas entre populações de moléculas, células e organismos resultantes do aumento da complexidade biológica. Assim, nesta tese de doutorado, buscou-se desenvolver workflows científicos utilizando-se ferramentas de bioinformática e biologia de sistemas para comparar processos biológicos através da geração de redes de interação proteínaproteína. Para tanto, o programa Dis2PPI foi gerado por meio de um workflow científico que possibilitou integrar os bancos de dados de doenças monogênicas OMIM (Online Mendelian Inheritance in Man) com o programa de metabuscas STRING (Search Tool for the Retrieval of Interacting Genes/Proteins). O objetivo desta integração foi gerar uma rede de interação proteína-proteína associada com doenças de natureza monogênica. Como prova de conceito, o programa Dis2PPI foi utilizado para a obtenção de redes de interação para as síndromes xeroderma pigmentosa e de Cockayne, duas doenças monogênicas raras e cujos fenótipos estão associados com acúmulos de danos de DNA, câncer, progeria e neurodegeneração. Uma vez geradas, estas redes foram avaliadas com o uso ferramentas de biologia de sistemas para análise de ontologia gênica e de centralidade no programa Cytoscape. Da mesma forma, o programa Net2Homology foi gerado através de um desenho de um workflow científico que possibilitasse integrar o resultado de um alinhamento de sequências de proteínas, usando o programa NCBI PSI-BLAST, com o programa de metabuscas STRING. Neste sentido, o programa Net2Homology possibilitou recuperar duas redes de interação proteína-proteína associada a dois organismos diferentes. Este mesmo programa foi utilizado para a obtenção de redes de interação para a doença xeroderma pigmentosa e para a enzima ciclo-oxigenase-1 cruzando as informações dos organismos Homo sapiens e Mus musculus. As redes de interação obtidas foram comparadas visando obter os processos biológicos evolutivamente conservados.
id UCS_f0f6e48df26279e790c22dbc670361d9
oai_identifier_str oai:repositorio.ucs.br:11338/694
network_acronym_str UCS
network_name_str Repositório Institucional da UCS
repository_id_str
spelling Notari, Daniel LuísVerli, HugoEcheverrigaray, SérgioRibeiro, Helena GraziottinBonatto, Diego2014-06-17T12:38:59Z2014-06-17T12:38:59Z2014-06-172012-12-12https://repositorio.ucs.br/handle/11338/694Workflows científicos são projetados para realizar experimentos in silico com o intuito de processar e analisar uma grande quantidade de dados usando simulação computacional. Os experimentos são organizados como uma sequência de etapas que caracterizam um fluxo de execução, onde em cada etapa utilizam-se diferentes softwares. Estes softwares não possuem um modelo de representação de dados comum. Por isto, quando um workflow científico é construído com o objetivo de integrar e processar dados, cada etapa precisa analisar a estrutura dos dados, processá-los e preparar os mesmos de acordo com a estrutura necessária para a execução da próxima etapa do workflow. Desta maneira, os workflows científicos usam diferentes algoritmos provenientes das áreas da matemática e da ciência da computação, os quais são capazes de processar, armazenar e transformar os dados utilizados em informação útil para diferentes análises de pesquisadores de biologia. Adicionalmente, a biologia de sistemas é uma subárea da bioinformática que ajuda a compreender as interações observadas entre populações de moléculas, células e organismos resultantes do aumento da complexidade biológica. Assim, nesta tese de doutorado, buscou-se desenvolver workflows científicos utilizando-se ferramentas de bioinformática e biologia de sistemas para comparar processos biológicos através da geração de redes de interação proteínaproteína. Para tanto, o programa Dis2PPI foi gerado por meio de um workflow científico que possibilitou integrar os bancos de dados de doenças monogênicas OMIM (Online Mendelian Inheritance in Man) com o programa de metabuscas STRING (Search Tool for the Retrieval of Interacting Genes/Proteins). O objetivo desta integração foi gerar uma rede de interação proteína-proteína associada com doenças de natureza monogênica. Como prova de conceito, o programa Dis2PPI foi utilizado para a obtenção de redes de interação para as síndromes xeroderma pigmentosa e de Cockayne, duas doenças monogênicas raras e cujos fenótipos estão associados com acúmulos de danos de DNA, câncer, progeria e neurodegeneração. Uma vez geradas, estas redes foram avaliadas com o uso ferramentas de biologia de sistemas para análise de ontologia gênica e de centralidade no programa Cytoscape. Da mesma forma, o programa Net2Homology foi gerado através de um desenho de um workflow científico que possibilitasse integrar o resultado de um alinhamento de sequências de proteínas, usando o programa NCBI PSI-BLAST, com o programa de metabuscas STRING. Neste sentido, o programa Net2Homology possibilitou recuperar duas redes de interação proteína-proteína associada a dois organismos diferentes. Este mesmo programa foi utilizado para a obtenção de redes de interação para a doença xeroderma pigmentosa e para a enzima ciclo-oxigenase-1 cruzando as informações dos organismos Homo sapiens e Mus musculus. As redes de interação obtidas foram comparadas visando obter os processos biológicos evolutivamente conservados.Scientific workflows can be used to design in silico experiments to process and analyse a great amount of data using computational simulation. In this sense, all in silico experiments are organized as a sequence of steps that characterize an execution flow, where each steps employ different softwares. It is important to note that these softwares do not employ a common structure or model to represent data. Thus, taking into account the diversity of softwares and data representation, a scientific workflow should be built to integrate and process data, where each step must be able to analyse the data structure, to process these data and finally generate a new data structure that provide the requirements needed to execute the next step of the workflow. It is important to note that scientific workflows use mathematics and computer sciences methods capable to process, storage, and transform these data into useful information. In addition, a subarea of Bioinformatics termed Systems biology helps to understand the interactions observed between populations of molecules, cells and organisms as the result of the increase of biological complexity. Thus, the purpose of this work was to develop scientific workflows using bioinformatics and system biology softwares with the purpose to compare different biological processes from the generation of proteinprotein interaction (PPI) networks. In this sense, the Dis2PPI software was design as a scientific workflow to integrate OMIM (Online Mendelian Inheritance in Man) database with metasearch program STRING (Search Tool for the Retrieval of Interacting Genes/Proteins) in order to retrieve protein-protein interaction networks associated to monogenic diseases. The Dis2PPI was used to generate PPI networks for xeroderma pigmentosum and cockayne syndromes, two rare monogenic diseases associated with DNA damage, cancer, progeria, and neurodegeneration. The PPI networks generated were analyzed with Cytoscape program and specific plugins that evaluate gene ontologies and centrality analysis. By its turn, Net2Homology program was designed as a scientific workflow to integrate NCBI PSI-BLAST sequence alignments with STRING metasearch program to recovery PPI networks associate with two different species. In this sense, Net2Homology was used to obtain PPI network for xeroderma pigmentosum disease and cyclooxigenase-1 enzyme by crossing Homo sapiens and Mus musculus information. A comparison between these networks was realized to verify the major evolutively conserved biological process.BioinformáticaBiotecnologiaBiologiaProteínasDesenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do Sulhttp://lattes.cnpq.br/0051814460033485NOTARI, D. L.Programa de Pós-Graduação em BiotecnologiaTEXTTese Daniel Luis Notari.pdf.txtTese Daniel Luis Notari.pdf.txtExtracted texttext/plain317733https://repositorio.ucs.br/xmlui/bitstream/11338/694/3/Tese%20Daniel%20Luis%20Notari.pdf.txt208dc032cdb258c9d9942b849e6cc8a3MD53THUMBNAILTese Daniel Luis Notari.pdf.jpgTese Daniel Luis Notari.pdf.jpgGenerated Thumbnailimage/jpeg1409https://repositorio.ucs.br/xmlui/bitstream/11338/694/4/Tese%20Daniel%20Luis%20Notari.pdf.jpg1af9768b56aad7419a80d523b86ec941MD54ORIGINALTese Daniel Luis Notari.pdfTese Daniel Luis Notari.pdfapplication/pdf7846140https://repositorio.ucs.br/xmlui/bitstream/11338/694/1/Tese%20Daniel%20Luis%20Notari.pdfebfd645042f867b8840d5ab9083411bcMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-8279https://repositorio.ucs.br/xmlui/bitstream/11338/694/2/license.txtdeeb8fa550aaa0758114cbdeb0c0955dMD5211338/6942018-08-17 06:15:39.07oai:repositorio.ucs.br:11338/694IERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gCiBEZWNsYXJhIHRhbWLDqW0gcXVlIGEgZW50cmVnYSBkbyBkb2N1bWVudG8gbsOjbyBpbmZyaW5nZSwgdGFudG8gcXVhbnRvIGxoZSDDqSBwb3Nzw612ZWwgc2FiZXIsIG9zIGRpcmVpdG9zIGRlIHF1YWxxdWVyIG91dHJhIHBlc3NvYSBvdSBlbnRpZGFkZS4KRepositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2018-08-17T06:15:39Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false
dc.title.pt_BR.fl_str_mv Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas
title Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas
spellingShingle Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas
Notari, Daniel Luís
Bioinformática
Biotecnologia
Biologia
Proteínas
title_short Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas
title_full Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas
title_fullStr Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas
title_full_unstemmed Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas
title_sort Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas
author Notari, Daniel Luís
author_facet Notari, Daniel Luís
author_role author
dc.contributor.other.none.fl_str_mv Verli, Hugo
Echeverrigaray, Sérgio
Ribeiro, Helena Graziottin
dc.contributor.author.fl_str_mv Notari, Daniel Luís
dc.contributor.advisor1.fl_str_mv Bonatto, Diego
contributor_str_mv Bonatto, Diego
dc.subject.por.fl_str_mv Bioinformática
Biotecnologia
Biologia
Proteínas
topic Bioinformática
Biotecnologia
Biologia
Proteínas
description Workflows científicos são projetados para realizar experimentos in silico com o intuito de processar e analisar uma grande quantidade de dados usando simulação computacional. Os experimentos são organizados como uma sequência de etapas que caracterizam um fluxo de execução, onde em cada etapa utilizam-se diferentes softwares. Estes softwares não possuem um modelo de representação de dados comum. Por isto, quando um workflow científico é construído com o objetivo de integrar e processar dados, cada etapa precisa analisar a estrutura dos dados, processá-los e preparar os mesmos de acordo com a estrutura necessária para a execução da próxima etapa do workflow. Desta maneira, os workflows científicos usam diferentes algoritmos provenientes das áreas da matemática e da ciência da computação, os quais são capazes de processar, armazenar e transformar os dados utilizados em informação útil para diferentes análises de pesquisadores de biologia. Adicionalmente, a biologia de sistemas é uma subárea da bioinformática que ajuda a compreender as interações observadas entre populações de moléculas, células e organismos resultantes do aumento da complexidade biológica. Assim, nesta tese de doutorado, buscou-se desenvolver workflows científicos utilizando-se ferramentas de bioinformática e biologia de sistemas para comparar processos biológicos através da geração de redes de interação proteínaproteína. Para tanto, o programa Dis2PPI foi gerado por meio de um workflow científico que possibilitou integrar os bancos de dados de doenças monogênicas OMIM (Online Mendelian Inheritance in Man) com o programa de metabuscas STRING (Search Tool for the Retrieval of Interacting Genes/Proteins). O objetivo desta integração foi gerar uma rede de interação proteína-proteína associada com doenças de natureza monogênica. Como prova de conceito, o programa Dis2PPI foi utilizado para a obtenção de redes de interação para as síndromes xeroderma pigmentosa e de Cockayne, duas doenças monogênicas raras e cujos fenótipos estão associados com acúmulos de danos de DNA, câncer, progeria e neurodegeneração. Uma vez geradas, estas redes foram avaliadas com o uso ferramentas de biologia de sistemas para análise de ontologia gênica e de centralidade no programa Cytoscape. Da mesma forma, o programa Net2Homology foi gerado através de um desenho de um workflow científico que possibilitasse integrar o resultado de um alinhamento de sequências de proteínas, usando o programa NCBI PSI-BLAST, com o programa de metabuscas STRING. Neste sentido, o programa Net2Homology possibilitou recuperar duas redes de interação proteína-proteína associada a dois organismos diferentes. Este mesmo programa foi utilizado para a obtenção de redes de interação para a doença xeroderma pigmentosa e para a enzima ciclo-oxigenase-1 cruzando as informações dos organismos Homo sapiens e Mus musculus. As redes de interação obtidas foram comparadas visando obter os processos biológicos evolutivamente conservados.
publishDate 2012
dc.date.submitted.none.fl_str_mv 2012-12-12
dc.date.accessioned.fl_str_mv 2014-06-17T12:38:59Z
dc.date.available.fl_str_mv 2014-06-17T12:38:59Z
dc.date.issued.fl_str_mv 2014-06-17
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ucs.br/handle/11338/694
url https://repositorio.ucs.br/handle/11338/694
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UCS
instname:Universidade de Caxias do Sul (UCS)
instacron:UCS
instname_str Universidade de Caxias do Sul (UCS)
instacron_str UCS
institution UCS
reponame_str Repositório Institucional da UCS
collection Repositório Institucional da UCS
bitstream.url.fl_str_mv https://repositorio.ucs.br/xmlui/bitstream/11338/694/3/Tese%20Daniel%20Luis%20Notari.pdf.txt
https://repositorio.ucs.br/xmlui/bitstream/11338/694/4/Tese%20Daniel%20Luis%20Notari.pdf.jpg
https://repositorio.ucs.br/xmlui/bitstream/11338/694/1/Tese%20Daniel%20Luis%20Notari.pdf
https://repositorio.ucs.br/xmlui/bitstream/11338/694/2/license.txt
bitstream.checksum.fl_str_mv 208dc032cdb258c9d9942b849e6cc8a3
1af9768b56aad7419a80d523b86ec941
ebfd645042f867b8840d5ab9083411bc
deeb8fa550aaa0758114cbdeb0c0955d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)
repository.mail.fl_str_mv
_version_ 1798308881450926080