Análise funcional de eventos de Splicing alternativo

Detalhes bibliográficos
Autor(a) principal: Coelho, Vitor Lima
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações do LNCC
Texto Completo: https://tede.lncc.br/handle/tede/212
Resumo: Splicing Alternativo (SA) é um mecanismo pós-transcricional que produz mais de um produto de gene, através da combinação de diferente éxons do lócus genômico, gerando grande parcela da variedade do proteoma dos eucariotos. Ao longo da última década, como seu papel regulatório tornou-se mais e mais evidente, SA tornou-se um fator chave para criação de complexidade de diferentes organismos dado um repertório constante de genes através das gerações. Através da inserção, exclusão ou substituição de partes da sequência do transcrito, SA pode obviamente também ter um impacto nos domínios funcionais de proteínas. Apesar de algumas tentativas que tem sido principalmente prejudicadas por questões técnicas causada pela redundância nas sequências transcritos alternativos, os efeitos em larga escala do SA em nível funcional tem sido pouco estudados até os dias de hoje. Este projeto descreve o desenvolvimento de uma ferramenta computacional chamada ASTAFUNK - Alternative Splicing Trancriptional Analyses with FUNctional Knowledge - um programa stand-alone automatizado e eficiente para estudar como a diversidade de determinado transcriptoma é traduzido em variação funcional, baseado em um padrão de anotação de transcriptomas (em GTF, Gene Transfer Format) e perfis de domínios (no formato do Pfam). Resumidamente, ASTAFUNK traduz as regiões que sofreram splicing alternativo de open read frames em sequências de aminoácidos, que subsequentemente são alinhadas com o profile Hidden Markov Model da base de dados do Pfam, empregando programação dinâmica padrão (algoritmo de Viterbi) com alguns refinamentos técnicos (isto é, abordagem branch-and-bound). Em contraste com ferramentas convencionais de predição de domínios (por exemplo, HMMER), o algoritmo de ASTAFUNK foi projetado para evitar escaneamentos redundantes de sequências em transcriptomas com alto grau de SA. Neste trabalho, aspectos teóricos e práticos da abordagem do ASTAFUNK são avaliados, e a eficiente implementação em JAVA é disponível livremente na internet sob BSD 3-clause open source license.
id LNCC_6b68dfc1866f1f4f3497899efe1f5b6b
oai_identifier_str oai:tede-server.lncc.br:tede/212
network_acronym_str LNCC
network_name_str Biblioteca Digital de Teses e Dissertações do LNCC
repository_id_str
spelling Sammeth, Michelhttp://lattes.cnpq.br/4491595267383714Nicolas, Marisa Fabianahttp://lattes.cnpq.br/0717161560405537Dardenne, Laurent Emmanuelhttp://lattes.cnpq.br/8344194525615133Stoye, Jenshttp://lattes.cnpq.br/2083738229023148http://lattes.cnpq.br/3104488709288770Coelho, Vitor Lima2015-09-23T19:20:12Z2015-02-26COELHO, V. L. Análise funcional de eventos de Splicing alternativo, 2015, xxi, 75 f. Dissertação (Mestrado em Modelagem Computacional), Programa de Pós-Graduação de Modelagem Computacional, Laboratório Nacional de Computação Científica, Petrópolis, 2015.https://tede.lncc.br/handle/tede/212Splicing Alternativo (SA) é um mecanismo pós-transcricional que produz mais de um produto de gene, através da combinação de diferente éxons do lócus genômico, gerando grande parcela da variedade do proteoma dos eucariotos. Ao longo da última década, como seu papel regulatório tornou-se mais e mais evidente, SA tornou-se um fator chave para criação de complexidade de diferentes organismos dado um repertório constante de genes através das gerações. Através da inserção, exclusão ou substituição de partes da sequência do transcrito, SA pode obviamente também ter um impacto nos domínios funcionais de proteínas. Apesar de algumas tentativas que tem sido principalmente prejudicadas por questões técnicas causada pela redundância nas sequências transcritos alternativos, os efeitos em larga escala do SA em nível funcional tem sido pouco estudados até os dias de hoje. Este projeto descreve o desenvolvimento de uma ferramenta computacional chamada ASTAFUNK - Alternative Splicing Trancriptional Analyses with FUNctional Knowledge - um programa stand-alone automatizado e eficiente para estudar como a diversidade de determinado transcriptoma é traduzido em variação funcional, baseado em um padrão de anotação de transcriptomas (em GTF, Gene Transfer Format) e perfis de domínios (no formato do Pfam). Resumidamente, ASTAFUNK traduz as regiões que sofreram splicing alternativo de open read frames em sequências de aminoácidos, que subsequentemente são alinhadas com o profile Hidden Markov Model da base de dados do Pfam, empregando programação dinâmica padrão (algoritmo de Viterbi) com alguns refinamentos técnicos (isto é, abordagem branch-and-bound). Em contraste com ferramentas convencionais de predição de domínios (por exemplo, HMMER), o algoritmo de ASTAFUNK foi projetado para evitar escaneamentos redundantes de sequências em transcriptomas com alto grau de SA. Neste trabalho, aspectos teóricos e práticos da abordagem do ASTAFUNK são avaliados, e a eficiente implementação em JAVA é disponível livremente na internet sob BSD 3-clause open source license.Alternative splicing (AS) is a mechanism that produces more than one gene product at the transcriptional level, by combining different exons of a gene, generating a major part of the proteome diversity in eukaryotes. Over the last decade, as the regulatory role of splicing has become more and more evident, AS turned a key factor in creating different organism complexity given a rather constant repertoire of genes across generations. By inserting, deleting or substituting part of the transcript sequence, AS can obviously also have an impact on functional protein domains. Despite some attempts that have mainly been hampered by technical issues caused by the redundancy in alternative transcript sequences, the large-scale effects of AS on the functional level has been poorly studied so far. This project describes the development of a computational tool called ASTAFUNK - Alternative Splicing Trancriptional Analyses with FUNctional Knowledge - an automated and efficient stand-alone program to study how diversity of a custom transcriptome translates into functional variation, based on standard transcriptome annotations (in GTF, Gene Transfer Format) and domain profiles (in Pfam format). In a nutshell, \afunk{} translates the alternatively spliced parts of open reading frames on the fly into amino acid sequences, which subsequently are aligned with the profile Hidden Markov Models from Pfam employing standard dynamic programming (Viterbi's algorithm) with some technical refinements (i.e., a branch-and-bound approach). In contrast to conventional domain prediction tools (e.g., the HMMER aligner), the ASTAFUNK algorithm has been designed to avoid redundant sequence scans in AS-enriched transcriptomes. In this work, theoretical and practical aspects of the ASTAFUNK approach are evaluated, and the efficient JAVA implementation is made freely available over the internet under the BSD 3-clause open source license.Submitted by Maria Cristina (library@lncc.br) on 2015-09-23T19:19:26Z No. of bitstreams: 1 dissertacao-vitor.pdf: 1691206 bytes, checksum: fef620f128c4346f7ff506439cdffdfd (MD5)Approved for entry into archive by Maria Cristina (library@lncc.br) on 2015-09-23T19:20:00Z (GMT) No. of bitstreams: 1 dissertacao-vitor.pdf: 1691206 bytes, checksum: fef620f128c4346f7ff506439cdffdfd (MD5)Made available in DSpace on 2015-09-23T19:20:12Z (GMT). No. of bitstreams: 1 dissertacao-vitor.pdf: 1691206 bytes, checksum: fef620f128c4346f7ff506439cdffdfd (MD5) Previous issue date: 2015-03-31Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)application/pdfhttp://tede-server.lncc.br:8080/retrieve/410/dissertacao-vitor.pdf.jpgporLaboratório Nacional de Computação CientíficaPrograma de Pós-Graduação em Modelagem ComputacionalLNCCBrasilServiço de Análise e Apoio a Formação de Recursos HumanosBioinformáticaDomínios de proteinasSplicing alternativoDomain proteinsAlternative SplicingBioinformaticsCNPQ::CIENCIAS BIOLOGICASCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAnálise funcional de eventos de Splicing alternativoFunctional analysis of alternative Splicing eventsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCCLICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://tede-server.lncc.br:8080/tede/bitstream/tede/212/1/license.txtbd3efa91386c1718a7f26a329fdcb468MD51ORIGINALdissertacao-vitor.pdfdissertacao-vitor.pdfapplication/pdf1691206http://tede-server.lncc.br:8080/tede/bitstream/tede/212/2/dissertacao-vitor.pdffef620f128c4346f7ff506439cdffdfdMD52THUMBNAILdissertacao-vitor.pdf.jpgdissertacao-vitor.pdf.jpgimage/jpeg2944http://tede-server.lncc.br:8080/tede/bitstream/tede/212/3/dissertacao-vitor.pdf.jpg5be1ce7a2d8897ef155e5d5a5dc09020MD53tede/2122023-06-01 13:46:26.507oai:tede-server.lncc.br:tede/212Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2023-06-01T16:46:26Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false
dc.title.por.fl_str_mv Análise funcional de eventos de Splicing alternativo
dc.title.alternative.por.fl_str_mv Functional analysis of alternative Splicing events
title Análise funcional de eventos de Splicing alternativo
spellingShingle Análise funcional de eventos de Splicing alternativo
Coelho, Vitor Lima
Bioinformática
Domínios de proteinas
Splicing alternativo
Domain proteins
Alternative Splicing
Bioinformatics
CNPQ::CIENCIAS BIOLOGICAS
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Análise funcional de eventos de Splicing alternativo
title_full Análise funcional de eventos de Splicing alternativo
title_fullStr Análise funcional de eventos de Splicing alternativo
title_full_unstemmed Análise funcional de eventos de Splicing alternativo
title_sort Análise funcional de eventos de Splicing alternativo
author Coelho, Vitor Lima
author_facet Coelho, Vitor Lima
author_role author
dc.contributor.advisor1.fl_str_mv Sammeth, Michel
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/4491595267383714
dc.contributor.advisor2.fl_str_mv Nicolas, Marisa Fabiana
dc.contributor.advisor2Lattes.fl_str_mv http://lattes.cnpq.br/0717161560405537
dc.contributor.referee1.fl_str_mv Dardenne, Laurent Emmanuel
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/8344194525615133
dc.contributor.referee2.fl_str_mv Stoye, Jens
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/2083738229023148
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/3104488709288770
dc.contributor.author.fl_str_mv Coelho, Vitor Lima
contributor_str_mv Sammeth, Michel
Nicolas, Marisa Fabiana
Dardenne, Laurent Emmanuel
Stoye, Jens
dc.subject.por.fl_str_mv Bioinformática
Domínios de proteinas
Splicing alternativo
Domain proteins
Alternative Splicing
topic Bioinformática
Domínios de proteinas
Splicing alternativo
Domain proteins
Alternative Splicing
Bioinformatics
CNPQ::CIENCIAS BIOLOGICAS
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Bioinformatics
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS BIOLOGICAS
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Splicing Alternativo (SA) é um mecanismo pós-transcricional que produz mais de um produto de gene, através da combinação de diferente éxons do lócus genômico, gerando grande parcela da variedade do proteoma dos eucariotos. Ao longo da última década, como seu papel regulatório tornou-se mais e mais evidente, SA tornou-se um fator chave para criação de complexidade de diferentes organismos dado um repertório constante de genes através das gerações. Através da inserção, exclusão ou substituição de partes da sequência do transcrito, SA pode obviamente também ter um impacto nos domínios funcionais de proteínas. Apesar de algumas tentativas que tem sido principalmente prejudicadas por questões técnicas causada pela redundância nas sequências transcritos alternativos, os efeitos em larga escala do SA em nível funcional tem sido pouco estudados até os dias de hoje. Este projeto descreve o desenvolvimento de uma ferramenta computacional chamada ASTAFUNK - Alternative Splicing Trancriptional Analyses with FUNctional Knowledge - um programa stand-alone automatizado e eficiente para estudar como a diversidade de determinado transcriptoma é traduzido em variação funcional, baseado em um padrão de anotação de transcriptomas (em GTF, Gene Transfer Format) e perfis de domínios (no formato do Pfam). Resumidamente, ASTAFUNK traduz as regiões que sofreram splicing alternativo de open read frames em sequências de aminoácidos, que subsequentemente são alinhadas com o profile Hidden Markov Model da base de dados do Pfam, empregando programação dinâmica padrão (algoritmo de Viterbi) com alguns refinamentos técnicos (isto é, abordagem branch-and-bound). Em contraste com ferramentas convencionais de predição de domínios (por exemplo, HMMER), o algoritmo de ASTAFUNK foi projetado para evitar escaneamentos redundantes de sequências em transcriptomas com alto grau de SA. Neste trabalho, aspectos teóricos e práticos da abordagem do ASTAFUNK são avaliados, e a eficiente implementação em JAVA é disponível livremente na internet sob BSD 3-clause open source license.
publishDate 2015
dc.date.accessioned.fl_str_mv 2015-09-23T19:20:12Z
dc.date.issued.fl_str_mv 2015-02-26
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv COELHO, V. L. Análise funcional de eventos de Splicing alternativo, 2015, xxi, 75 f. Dissertação (Mestrado em Modelagem Computacional), Programa de Pós-Graduação de Modelagem Computacional, Laboratório Nacional de Computação Científica, Petrópolis, 2015.
dc.identifier.uri.fl_str_mv https://tede.lncc.br/handle/tede/212
identifier_str_mv COELHO, V. L. Análise funcional de eventos de Splicing alternativo, 2015, xxi, 75 f. Dissertação (Mestrado em Modelagem Computacional), Programa de Pós-Graduação de Modelagem Computacional, Laboratório Nacional de Computação Científica, Petrópolis, 2015.
url https://tede.lncc.br/handle/tede/212
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Modelagem Computacional
dc.publisher.initials.fl_str_mv LNCC
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Serviço de Análise e Apoio a Formação de Recursos Humanos
publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do LNCC
instname:Laboratório Nacional de Computação Científica (LNCC)
instacron:LNCC
instname_str Laboratório Nacional de Computação Científica (LNCC)
instacron_str LNCC
institution LNCC
reponame_str Biblioteca Digital de Teses e Dissertações do LNCC
collection Biblioteca Digital de Teses e Dissertações do LNCC
bitstream.url.fl_str_mv http://tede-server.lncc.br:8080/tede/bitstream/tede/212/1/license.txt
http://tede-server.lncc.br:8080/tede/bitstream/tede/212/2/dissertacao-vitor.pdf
http://tede-server.lncc.br:8080/tede/bitstream/tede/212/3/dissertacao-vitor.pdf.jpg
bitstream.checksum.fl_str_mv bd3efa91386c1718a7f26a329fdcb468
fef620f128c4346f7ff506439cdffdfd
5be1ce7a2d8897ef155e5d5a5dc09020
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)
repository.mail.fl_str_mv library@lncc.br||library@lncc.br
_version_ 1797683218070110208