Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UCS |
Texto Completo: | https://repositorio.ucs.br/handle/11338/694 |
Resumo: | Workflows científicos são projetados para realizar experimentos in silico com o intuito de processar e analisar uma grande quantidade de dados usando simulação computacional. Os experimentos são organizados como uma sequência de etapas que caracterizam um fluxo de execução, onde em cada etapa utilizam-se diferentes softwares. Estes softwares não possuem um modelo de representação de dados comum. Por isto, quando um workflow científico é construído com o objetivo de integrar e processar dados, cada etapa precisa analisar a estrutura dos dados, processá-los e preparar os mesmos de acordo com a estrutura necessária para a execução da próxima etapa do workflow. Desta maneira, os workflows científicos usam diferentes algoritmos provenientes das áreas da matemática e da ciência da computação, os quais são capazes de processar, armazenar e transformar os dados utilizados em informação útil para diferentes análises de pesquisadores de biologia. Adicionalmente, a biologia de sistemas é uma subárea da bioinformática que ajuda a compreender as interações observadas entre populações de moléculas, células e organismos resultantes do aumento da complexidade biológica. Assim, nesta tese de doutorado, buscou-se desenvolver workflows científicos utilizando-se ferramentas de bioinformática e biologia de sistemas para comparar processos biológicos através da geração de redes de interação proteínaproteína. Para tanto, o programa Dis2PPI foi gerado por meio de um workflow científico que possibilitou integrar os bancos de dados de doenças monogênicas OMIM (Online Mendelian Inheritance in Man) com o programa de metabuscas STRING (Search Tool for the Retrieval of Interacting Genes/Proteins). O objetivo desta integração foi gerar uma rede de interação proteína-proteína associada com doenças de natureza monogênica. Como prova de conceito, o programa Dis2PPI foi utilizado para a obtenção de redes de interação para as síndromes xeroderma pigmentosa e de Cockayne, duas doenças monogênicas raras e cujos fenótipos estão associados com acúmulos de danos de DNA, câncer, progeria e neurodegeneração. Uma vez geradas, estas redes foram avaliadas com o uso ferramentas de biologia de sistemas para análise de ontologia gênica e de centralidade no programa Cytoscape. Da mesma forma, o programa Net2Homology foi gerado através de um desenho de um workflow científico que possibilitasse integrar o resultado de um alinhamento de sequências de proteínas, usando o programa NCBI PSI-BLAST, com o programa de metabuscas STRING. Neste sentido, o programa Net2Homology possibilitou recuperar duas redes de interação proteína-proteína associada a dois organismos diferentes. Este mesmo programa foi utilizado para a obtenção de redes de interação para a doença xeroderma pigmentosa e para a enzima ciclo-oxigenase-1 cruzando as informações dos organismos Homo sapiens e Mus musculus. As redes de interação obtidas foram comparadas visando obter os processos biológicos evolutivamente conservados. |
id |
UCS_f0f6e48df26279e790c22dbc670361d9 |
---|---|
oai_identifier_str |
oai:repositorio.ucs.br:11338/694 |
network_acronym_str |
UCS |
network_name_str |
Repositório Institucional da UCS |
repository_id_str |
|
spelling |
Notari, Daniel LuísVerli, HugoEcheverrigaray, SérgioRibeiro, Helena GraziottinBonatto, Diego2014-06-17T12:38:59Z2014-06-17T12:38:59Z2014-06-172012-12-12https://repositorio.ucs.br/handle/11338/694Workflows científicos são projetados para realizar experimentos in silico com o intuito de processar e analisar uma grande quantidade de dados usando simulação computacional. Os experimentos são organizados como uma sequência de etapas que caracterizam um fluxo de execução, onde em cada etapa utilizam-se diferentes softwares. Estes softwares não possuem um modelo de representação de dados comum. Por isto, quando um workflow científico é construído com o objetivo de integrar e processar dados, cada etapa precisa analisar a estrutura dos dados, processá-los e preparar os mesmos de acordo com a estrutura necessária para a execução da próxima etapa do workflow. Desta maneira, os workflows científicos usam diferentes algoritmos provenientes das áreas da matemática e da ciência da computação, os quais são capazes de processar, armazenar e transformar os dados utilizados em informação útil para diferentes análises de pesquisadores de biologia. Adicionalmente, a biologia de sistemas é uma subárea da bioinformática que ajuda a compreender as interações observadas entre populações de moléculas, células e organismos resultantes do aumento da complexidade biológica. Assim, nesta tese de doutorado, buscou-se desenvolver workflows científicos utilizando-se ferramentas de bioinformática e biologia de sistemas para comparar processos biológicos através da geração de redes de interação proteínaproteína. Para tanto, o programa Dis2PPI foi gerado por meio de um workflow científico que possibilitou integrar os bancos de dados de doenças monogênicas OMIM (Online Mendelian Inheritance in Man) com o programa de metabuscas STRING (Search Tool for the Retrieval of Interacting Genes/Proteins). O objetivo desta integração foi gerar uma rede de interação proteína-proteína associada com doenças de natureza monogênica. Como prova de conceito, o programa Dis2PPI foi utilizado para a obtenção de redes de interação para as síndromes xeroderma pigmentosa e de Cockayne, duas doenças monogênicas raras e cujos fenótipos estão associados com acúmulos de danos de DNA, câncer, progeria e neurodegeneração. Uma vez geradas, estas redes foram avaliadas com o uso ferramentas de biologia de sistemas para análise de ontologia gênica e de centralidade no programa Cytoscape. Da mesma forma, o programa Net2Homology foi gerado através de um desenho de um workflow científico que possibilitasse integrar o resultado de um alinhamento de sequências de proteínas, usando o programa NCBI PSI-BLAST, com o programa de metabuscas STRING. Neste sentido, o programa Net2Homology possibilitou recuperar duas redes de interação proteína-proteína associada a dois organismos diferentes. Este mesmo programa foi utilizado para a obtenção de redes de interação para a doença xeroderma pigmentosa e para a enzima ciclo-oxigenase-1 cruzando as informações dos organismos Homo sapiens e Mus musculus. As redes de interação obtidas foram comparadas visando obter os processos biológicos evolutivamente conservados.Scientific workflows can be used to design in silico experiments to process and analyse a great amount of data using computational simulation. In this sense, all in silico experiments are organized as a sequence of steps that characterize an execution flow, where each steps employ different softwares. It is important to note that these softwares do not employ a common structure or model to represent data. Thus, taking into account the diversity of softwares and data representation, a scientific workflow should be built to integrate and process data, where each step must be able to analyse the data structure, to process these data and finally generate a new data structure that provide the requirements needed to execute the next step of the workflow. It is important to note that scientific workflows use mathematics and computer sciences methods capable to process, storage, and transform these data into useful information. In addition, a subarea of Bioinformatics termed Systems biology helps to understand the interactions observed between populations of molecules, cells and organisms as the result of the increase of biological complexity. Thus, the purpose of this work was to develop scientific workflows using bioinformatics and system biology softwares with the purpose to compare different biological processes from the generation of proteinprotein interaction (PPI) networks. In this sense, the Dis2PPI software was design as a scientific workflow to integrate OMIM (Online Mendelian Inheritance in Man) database with metasearch program STRING (Search Tool for the Retrieval of Interacting Genes/Proteins) in order to retrieve protein-protein interaction networks associated to monogenic diseases. The Dis2PPI was used to generate PPI networks for xeroderma pigmentosum and cockayne syndromes, two rare monogenic diseases associated with DNA damage, cancer, progeria, and neurodegeneration. The PPI networks generated were analyzed with Cytoscape program and specific plugins that evaluate gene ontologies and centrality analysis. By its turn, Net2Homology program was designed as a scientific workflow to integrate NCBI PSI-BLAST sequence alignments with STRING metasearch program to recovery PPI networks associate with two different species. In this sense, Net2Homology was used to obtain PPI network for xeroderma pigmentosum disease and cyclooxigenase-1 enzyme by crossing Homo sapiens and Mus musculus information. A comparison between these networks was realized to verify the major evolutively conserved biological process.BioinformáticaBiotecnologiaBiologiaProteínasDesenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do Sulhttp://lattes.cnpq.br/0051814460033485NOTARI, D. L.Programa de Pós-Graduação em BiotecnologiaTEXTTese Daniel Luis Notari.pdf.txtTese Daniel Luis Notari.pdf.txtExtracted texttext/plain317733https://repositorio.ucs.br/xmlui/bitstream/11338/694/3/Tese%20Daniel%20Luis%20Notari.pdf.txt208dc032cdb258c9d9942b849e6cc8a3MD53THUMBNAILTese Daniel Luis Notari.pdf.jpgTese Daniel Luis Notari.pdf.jpgGenerated Thumbnailimage/jpeg1409https://repositorio.ucs.br/xmlui/bitstream/11338/694/4/Tese%20Daniel%20Luis%20Notari.pdf.jpg1af9768b56aad7419a80d523b86ec941MD54ORIGINALTese Daniel Luis Notari.pdfTese Daniel Luis Notari.pdfapplication/pdf7846140https://repositorio.ucs.br/xmlui/bitstream/11338/694/1/Tese%20Daniel%20Luis%20Notari.pdfebfd645042f867b8840d5ab9083411bcMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-8279https://repositorio.ucs.br/xmlui/bitstream/11338/694/2/license.txtdeeb8fa550aaa0758114cbdeb0c0955dMD5211338/6942018-08-17 06:15:39.07oai:repositorio.ucs.br:11338/694IERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gCiBEZWNsYXJhIHRhbWLDqW0gcXVlIGEgZW50cmVnYSBkbyBkb2N1bWVudG8gbsOjbyBpbmZyaW5nZSwgdGFudG8gcXVhbnRvIGxoZSDDqSBwb3Nzw612ZWwgc2FiZXIsIG9zIGRpcmVpdG9zIGRlIHF1YWxxdWVyIG91dHJhIHBlc3NvYSBvdSBlbnRpZGFkZS4KRepositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2024-05-06T10:01:06.188192Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false |
dc.title.pt_BR.fl_str_mv |
Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas |
title |
Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas |
spellingShingle |
Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas Notari, Daniel Luís Bioinformática Biotecnologia Biologia Proteínas |
title_short |
Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas |
title_full |
Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas |
title_fullStr |
Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas |
title_full_unstemmed |
Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas |
title_sort |
Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas |
author |
Notari, Daniel Luís |
author_facet |
Notari, Daniel Luís |
author_role |
author |
dc.contributor.other.none.fl_str_mv |
Verli, Hugo Echeverrigaray, Sérgio Ribeiro, Helena Graziottin |
dc.contributor.author.fl_str_mv |
Notari, Daniel Luís |
dc.contributor.advisor1.fl_str_mv |
Bonatto, Diego |
contributor_str_mv |
Bonatto, Diego |
dc.subject.por.fl_str_mv |
Bioinformática Biotecnologia Biologia Proteínas |
topic |
Bioinformática Biotecnologia Biologia Proteínas |
description |
Workflows científicos são projetados para realizar experimentos in silico com o intuito de processar e analisar uma grande quantidade de dados usando simulação computacional. Os experimentos são organizados como uma sequência de etapas que caracterizam um fluxo de execução, onde em cada etapa utilizam-se diferentes softwares. Estes softwares não possuem um modelo de representação de dados comum. Por isto, quando um workflow científico é construído com o objetivo de integrar e processar dados, cada etapa precisa analisar a estrutura dos dados, processá-los e preparar os mesmos de acordo com a estrutura necessária para a execução da próxima etapa do workflow. Desta maneira, os workflows científicos usam diferentes algoritmos provenientes das áreas da matemática e da ciência da computação, os quais são capazes de processar, armazenar e transformar os dados utilizados em informação útil para diferentes análises de pesquisadores de biologia. Adicionalmente, a biologia de sistemas é uma subárea da bioinformática que ajuda a compreender as interações observadas entre populações de moléculas, células e organismos resultantes do aumento da complexidade biológica. Assim, nesta tese de doutorado, buscou-se desenvolver workflows científicos utilizando-se ferramentas de bioinformática e biologia de sistemas para comparar processos biológicos através da geração de redes de interação proteínaproteína. Para tanto, o programa Dis2PPI foi gerado por meio de um workflow científico que possibilitou integrar os bancos de dados de doenças monogênicas OMIM (Online Mendelian Inheritance in Man) com o programa de metabuscas STRING (Search Tool for the Retrieval of Interacting Genes/Proteins). O objetivo desta integração foi gerar uma rede de interação proteína-proteína associada com doenças de natureza monogênica. Como prova de conceito, o programa Dis2PPI foi utilizado para a obtenção de redes de interação para as síndromes xeroderma pigmentosa e de Cockayne, duas doenças monogênicas raras e cujos fenótipos estão associados com acúmulos de danos de DNA, câncer, progeria e neurodegeneração. Uma vez geradas, estas redes foram avaliadas com o uso ferramentas de biologia de sistemas para análise de ontologia gênica e de centralidade no programa Cytoscape. Da mesma forma, o programa Net2Homology foi gerado através de um desenho de um workflow científico que possibilitasse integrar o resultado de um alinhamento de sequências de proteínas, usando o programa NCBI PSI-BLAST, com o programa de metabuscas STRING. Neste sentido, o programa Net2Homology possibilitou recuperar duas redes de interação proteína-proteína associada a dois organismos diferentes. Este mesmo programa foi utilizado para a obtenção de redes de interação para a doença xeroderma pigmentosa e para a enzima ciclo-oxigenase-1 cruzando as informações dos organismos Homo sapiens e Mus musculus. As redes de interação obtidas foram comparadas visando obter os processos biológicos evolutivamente conservados. |
publishDate |
2012 |
dc.date.submitted.none.fl_str_mv |
2012-12-12 |
dc.date.accessioned.fl_str_mv |
2014-06-17T12:38:59Z |
dc.date.available.fl_str_mv |
2014-06-17T12:38:59Z |
dc.date.issued.fl_str_mv |
2014-06-17 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ucs.br/handle/11338/694 |
url |
https://repositorio.ucs.br/handle/11338/694 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UCS instname:Universidade de Caxias do Sul (UCS) instacron:UCS |
instname_str |
Universidade de Caxias do Sul (UCS) |
instacron_str |
UCS |
institution |
UCS |
reponame_str |
Repositório Institucional da UCS |
collection |
Repositório Institucional da UCS |
bitstream.url.fl_str_mv |
https://repositorio.ucs.br/xmlui/bitstream/11338/694/3/Tese%20Daniel%20Luis%20Notari.pdf.txt https://repositorio.ucs.br/xmlui/bitstream/11338/694/4/Tese%20Daniel%20Luis%20Notari.pdf.jpg https://repositorio.ucs.br/xmlui/bitstream/11338/694/1/Tese%20Daniel%20Luis%20Notari.pdf https://repositorio.ucs.br/xmlui/bitstream/11338/694/2/license.txt |
bitstream.checksum.fl_str_mv |
208dc032cdb258c9d9942b849e6cc8a3 1af9768b56aad7419a80d523b86ec941 ebfd645042f867b8840d5ab9083411bc deeb8fa550aaa0758114cbdeb0c0955d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS) |
repository.mail.fl_str_mv |
|
_version_ |
1813258430237900800 |