Cell biology informatics Two bioinformatic tools for the study of evolutionary cell biology

Detalhes bibliográficos
Autor(a) principal: Cadete, Filipe Bernardes da Silva Tavares
Data de Publicação: 2009
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/13855
Resumo: A capacidade de processar e relacionar vastas quantidades e vários tipos de dados e uma das vantagens que as tecnologias de informação e comunicação (TIC) trazem a biologia. Esta capacidade torna-se ainda mais importante quando está em causa o estudo da evolução de sistemas intra-celulares complexos, já que este só se torna possível ao contextualizar correctamente informação de diversos tipos (molecular, morfológica e taxonómica, por exemplo). Neste projecto aplicaram-se TIC na construção de recursos que possibilitam o estudo da evolução de duas características de Eucariotas: o sistema de transporte vesicular e centríolos. No ambiente compartimentalizado que é uma célula eucariota, o sistema de transporte vesicular permite a movimentação de diferentes cargas de um compartimento para outro, incluindo do interior para o exterior da célula e vice-versa. Este sistema está presente, de forma mais ou menos complexa, em todos os eucariotas, pelo que se assume que também esteve presente no _ultimo ancestral que estes têm em comum. Desde então adaptou-se aos diferentes estilos de vida e necessidades do eucariotas actuais. Para o estudo da evolução do sistema de transporte vesicular é necessário conhecer os perfis filogenéticos dos seus componentes, isto é, é necessário saber em que organismos estes componentes estão presentes ou ausentes. As proteínas do tipo rab são reguladores centrais deste sistema. O objectivo deste trabalho é a identificação e classificação desta família de proteínas num vasto número de organismos que cubram, na medida do possível, a diversidade existente em Eucariotas e a disponibilização destes resultados para a comunidade. Para cumprir este objectivo, foram utilizadas técnicas de aprendizagem automática e de manipulação de sequências para construir uma ferramenta de anotação automática de rabs. Esta ferramenta, apelidada de Rabifier, actua da seguinte forma: _ selecção de sequências candidatas através da sua semelhançaa com um conjunto discriminante de proteínas rab e n~ao-rab. A semelhançaa é medida recorrendo à ferramenta de alinhamento local BLAST; _ confirmação das sequências candidatas através da utilização da ferramenta de detecção de motivos lineares MEME/MAST para identificar motivos específicos das rabs; utilização de clustering para determinar se novas subfamílias devem ser criadas; classificação de sequências candidatas numa subfamília através de modelos representativos de conjuntos de sequências utilizando as ferramentas Psi-BLAST e RPS-BLAST; _ marcação automática dos resultados obtidos como sendo de confiança ou não. Seguiu-se uma verificação manual das sequências marcadas como não sendo de confiança. No final, de um total de 3058867 sequências de 182 organismos, foram identificadas mais de cinco mil sequências em 182 organismos. O conjunto destes dados permitiu uma análise preliminar de características particulares de proteínas rabs e a predição do conjunto de rabs do ancestral comum dos eucariotas. Os resultados obtidos foram disponibilizados no website Tra_cDB (http://www.igc.pt/tra_cdb). Este foi desenvolvido utilizando um back-end escrito em Python com base na web framework Django. A presença de citoesqueleto é outra característica que distingue eucariotas de procariotas. O citoesqueleto é composto por filamentos de actina, filamentos intermédios e microtúbulos. Estes últimos podem criar estruturas do tipo centriolar que são responsáveis por processos essenciais ao bom funcionamento da célula. Por exemplo, o centrosoma actua na segregação de cromossomas durante a divisão celular e tem no seu âmago um par de centríolos. Outras estruturas deste tipo incluem flagelos e cílios, que nucleiam protusões da membrana celular e permitem à célula mover-se ou sentir o ambiente envolvente. Estruturas centriolares aparecem em todos os principais grupos de eucariotas. Assim, como o sistema de transporte vesicular, postula-se que tenham origem num ancestral comum a todos os eucariotas. Mais uma vez, o estudo da evolução de uma estrutura ancestral poderá conduzir a uma melhor compreensão dos sistemas biológicos actuais. Há descrições de variações do esquema de organização destas estruturas, mas esta variabilidade, essencial para um estudo aprofundado da sua evolução, não se encontra catalogado nem centralizado. O objectivo deste trabalho é a criação de uma interface web, chamada CentrioleDB, para a anotação de imagens de microscopia electrónica de estruturas centriolares. Esta anotação é feita manualmente utilizando um dicionário controlado desenvolvido por especialistas no estudo destas estruturas. Para além de possibilitar a anotação de imagens, a CentrioleDB também permite a visualização de imagens já anotadas num contexto taxonómico e molecular. Um utilizador pode rapidamente descobrir em que organismos é que uma determinada estrutura aparece, que proteínas foram experimentalmente mapeadas nessa estrutura e quais os seus ortólogos. Esta é a primeira fase de um projecto de colaboração com grupos ligados à comunidade centriolar. Á medida que os dados de anotação ficam mais completos, poderemos comparar perfis de estruturas e moléculas e fazer previsões sobre que moléculas têm funções relacionadas com estas estruturas. A implementação da CentrioleDB foi feita utilizando uma base de dados relacional e a web framework Django. Foi necessário desenvolver: _ uma estrutura de base de dados que aceite facilmente mudanças e acrescentos ao dicionário controlado de anotação, uma vez que este encontra-se em permanente desenvolvimento e actualização por peritos na área. _ um backend que lida com o upload deficheiros de imagens e mantém a ligação entre estas e as respectivas anotações. _ uma interface que permita a anotação e a visualização de informação de uma forma intuitiva para o utilizador. Neste momento a CentrioleDB encontra-se em funcionamento em http://www.igc.pt/centrioledb e disponível a um grupo restrito de utilizadores por razões de copyright. As duas ferramentas aqui descritas têm em comum o facto de propiciarem às respectivas comunidades um local dedicado ao estudo da evolução dos respectivos sistemas. A integração de informação relevante com taxonomia contextualiza-a de uma forma que facilita uma visão global e abrangente da evolução destes sistemas essenciais a todos os eucariotas.
id RCAP_cafb56161218cc303a721f8f1988b7c8
oai_identifier_str oai:repositorio.ul.pt:10451/13855
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Cell biology informatics Two bioinformatic tools for the study of evolutionary cell biologyanotação automática de proteínasanotação manual de imagenscentríolosEvolução em eucariotasdesenvolvimento de interfaces web de bases de dados.proteínas rabmanipulação de sequênciasA capacidade de processar e relacionar vastas quantidades e vários tipos de dados e uma das vantagens que as tecnologias de informação e comunicação (TIC) trazem a biologia. Esta capacidade torna-se ainda mais importante quando está em causa o estudo da evolução de sistemas intra-celulares complexos, já que este só se torna possível ao contextualizar correctamente informação de diversos tipos (molecular, morfológica e taxonómica, por exemplo). Neste projecto aplicaram-se TIC na construção de recursos que possibilitam o estudo da evolução de duas características de Eucariotas: o sistema de transporte vesicular e centríolos. No ambiente compartimentalizado que é uma célula eucariota, o sistema de transporte vesicular permite a movimentação de diferentes cargas de um compartimento para outro, incluindo do interior para o exterior da célula e vice-versa. Este sistema está presente, de forma mais ou menos complexa, em todos os eucariotas, pelo que se assume que também esteve presente no _ultimo ancestral que estes têm em comum. Desde então adaptou-se aos diferentes estilos de vida e necessidades do eucariotas actuais. Para o estudo da evolução do sistema de transporte vesicular é necessário conhecer os perfis filogenéticos dos seus componentes, isto é, é necessário saber em que organismos estes componentes estão presentes ou ausentes. As proteínas do tipo rab são reguladores centrais deste sistema. O objectivo deste trabalho é a identificação e classificação desta família de proteínas num vasto número de organismos que cubram, na medida do possível, a diversidade existente em Eucariotas e a disponibilização destes resultados para a comunidade. Para cumprir este objectivo, foram utilizadas técnicas de aprendizagem automática e de manipulação de sequências para construir uma ferramenta de anotação automática de rabs. Esta ferramenta, apelidada de Rabifier, actua da seguinte forma: _ selecção de sequências candidatas através da sua semelhançaa com um conjunto discriminante de proteínas rab e n~ao-rab. A semelhançaa é medida recorrendo à ferramenta de alinhamento local BLAST; _ confirmação das sequências candidatas através da utilização da ferramenta de detecção de motivos lineares MEME/MAST para identificar motivos específicos das rabs; utilização de clustering para determinar se novas subfamílias devem ser criadas; classificação de sequências candidatas numa subfamília através de modelos representativos de conjuntos de sequências utilizando as ferramentas Psi-BLAST e RPS-BLAST; _ marcação automática dos resultados obtidos como sendo de confiança ou não. Seguiu-se uma verificação manual das sequências marcadas como não sendo de confiança. No final, de um total de 3058867 sequências de 182 organismos, foram identificadas mais de cinco mil sequências em 182 organismos. O conjunto destes dados permitiu uma análise preliminar de características particulares de proteínas rabs e a predição do conjunto de rabs do ancestral comum dos eucariotas. Os resultados obtidos foram disponibilizados no website Tra_cDB (http://www.igc.pt/tra_cdb). Este foi desenvolvido utilizando um back-end escrito em Python com base na web framework Django. A presença de citoesqueleto é outra característica que distingue eucariotas de procariotas. O citoesqueleto é composto por filamentos de actina, filamentos intermédios e microtúbulos. Estes últimos podem criar estruturas do tipo centriolar que são responsáveis por processos essenciais ao bom funcionamento da célula. Por exemplo, o centrosoma actua na segregação de cromossomas durante a divisão celular e tem no seu âmago um par de centríolos. Outras estruturas deste tipo incluem flagelos e cílios, que nucleiam protusões da membrana celular e permitem à célula mover-se ou sentir o ambiente envolvente. Estruturas centriolares aparecem em todos os principais grupos de eucariotas. Assim, como o sistema de transporte vesicular, postula-se que tenham origem num ancestral comum a todos os eucariotas. Mais uma vez, o estudo da evolução de uma estrutura ancestral poderá conduzir a uma melhor compreensão dos sistemas biológicos actuais. Há descrições de variações do esquema de organização destas estruturas, mas esta variabilidade, essencial para um estudo aprofundado da sua evolução, não se encontra catalogado nem centralizado. O objectivo deste trabalho é a criação de uma interface web, chamada CentrioleDB, para a anotação de imagens de microscopia electrónica de estruturas centriolares. Esta anotação é feita manualmente utilizando um dicionário controlado desenvolvido por especialistas no estudo destas estruturas. Para além de possibilitar a anotação de imagens, a CentrioleDB também permite a visualização de imagens já anotadas num contexto taxonómico e molecular. Um utilizador pode rapidamente descobrir em que organismos é que uma determinada estrutura aparece, que proteínas foram experimentalmente mapeadas nessa estrutura e quais os seus ortólogos. Esta é a primeira fase de um projecto de colaboração com grupos ligados à comunidade centriolar. Á medida que os dados de anotação ficam mais completos, poderemos comparar perfis de estruturas e moléculas e fazer previsões sobre que moléculas têm funções relacionadas com estas estruturas. A implementação da CentrioleDB foi feita utilizando uma base de dados relacional e a web framework Django. Foi necessário desenvolver: _ uma estrutura de base de dados que aceite facilmente mudanças e acrescentos ao dicionário controlado de anotação, uma vez que este encontra-se em permanente desenvolvimento e actualização por peritos na área. _ um backend que lida com o upload deficheiros de imagens e mantém a ligação entre estas e as respectivas anotações. _ uma interface que permita a anotação e a visualização de informação de uma forma intuitiva para o utilizador. Neste momento a CentrioleDB encontra-se em funcionamento em http://www.igc.pt/centrioledb e disponível a um grupo restrito de utilizadores por razões de copyright. As duas ferramentas aqui descritas têm em comum o facto de propiciarem às respectivas comunidades um local dedicado ao estudo da evolução dos respectivos sistemas. A integração de informação relevante com taxonomia contextualiza-a de uma forma que facilita uma visão global e abrangente da evolução destes sistemas essenciais a todos os eucariotas.Falcão, André O.Repositório da Universidade de LisboaCadete, Filipe Bernardes da Silva Tavares2010-01-25T10:00:48Z20092009-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/13855porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T15:59:16Zoai:repositorio.ul.pt:10451/13855Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:35:46.539054Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Cell biology informatics Two bioinformatic tools for the study of evolutionary cell biology
title Cell biology informatics Two bioinformatic tools for the study of evolutionary cell biology
spellingShingle Cell biology informatics Two bioinformatic tools for the study of evolutionary cell biology
Cadete, Filipe Bernardes da Silva Tavares
anotação automática de proteínas
anotação manual de imagens
centríolos
Evolução em eucariotas
desenvolvimento de interfaces web de bases de dados.
proteínas rab
manipulação de sequências
title_short Cell biology informatics Two bioinformatic tools for the study of evolutionary cell biology
title_full Cell biology informatics Two bioinformatic tools for the study of evolutionary cell biology
title_fullStr Cell biology informatics Two bioinformatic tools for the study of evolutionary cell biology
title_full_unstemmed Cell biology informatics Two bioinformatic tools for the study of evolutionary cell biology
title_sort Cell biology informatics Two bioinformatic tools for the study of evolutionary cell biology
author Cadete, Filipe Bernardes da Silva Tavares
author_facet Cadete, Filipe Bernardes da Silva Tavares
author_role author
dc.contributor.none.fl_str_mv Falcão, André O.
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Cadete, Filipe Bernardes da Silva Tavares
dc.subject.por.fl_str_mv anotação automática de proteínas
anotação manual de imagens
centríolos
Evolução em eucariotas
desenvolvimento de interfaces web de bases de dados.
proteínas rab
manipulação de sequências
topic anotação automática de proteínas
anotação manual de imagens
centríolos
Evolução em eucariotas
desenvolvimento de interfaces web de bases de dados.
proteínas rab
manipulação de sequências
description A capacidade de processar e relacionar vastas quantidades e vários tipos de dados e uma das vantagens que as tecnologias de informação e comunicação (TIC) trazem a biologia. Esta capacidade torna-se ainda mais importante quando está em causa o estudo da evolução de sistemas intra-celulares complexos, já que este só se torna possível ao contextualizar correctamente informação de diversos tipos (molecular, morfológica e taxonómica, por exemplo). Neste projecto aplicaram-se TIC na construção de recursos que possibilitam o estudo da evolução de duas características de Eucariotas: o sistema de transporte vesicular e centríolos. No ambiente compartimentalizado que é uma célula eucariota, o sistema de transporte vesicular permite a movimentação de diferentes cargas de um compartimento para outro, incluindo do interior para o exterior da célula e vice-versa. Este sistema está presente, de forma mais ou menos complexa, em todos os eucariotas, pelo que se assume que também esteve presente no _ultimo ancestral que estes têm em comum. Desde então adaptou-se aos diferentes estilos de vida e necessidades do eucariotas actuais. Para o estudo da evolução do sistema de transporte vesicular é necessário conhecer os perfis filogenéticos dos seus componentes, isto é, é necessário saber em que organismos estes componentes estão presentes ou ausentes. As proteínas do tipo rab são reguladores centrais deste sistema. O objectivo deste trabalho é a identificação e classificação desta família de proteínas num vasto número de organismos que cubram, na medida do possível, a diversidade existente em Eucariotas e a disponibilização destes resultados para a comunidade. Para cumprir este objectivo, foram utilizadas técnicas de aprendizagem automática e de manipulação de sequências para construir uma ferramenta de anotação automática de rabs. Esta ferramenta, apelidada de Rabifier, actua da seguinte forma: _ selecção de sequências candidatas através da sua semelhançaa com um conjunto discriminante de proteínas rab e n~ao-rab. A semelhançaa é medida recorrendo à ferramenta de alinhamento local BLAST; _ confirmação das sequências candidatas através da utilização da ferramenta de detecção de motivos lineares MEME/MAST para identificar motivos específicos das rabs; utilização de clustering para determinar se novas subfamílias devem ser criadas; classificação de sequências candidatas numa subfamília através de modelos representativos de conjuntos de sequências utilizando as ferramentas Psi-BLAST e RPS-BLAST; _ marcação automática dos resultados obtidos como sendo de confiança ou não. Seguiu-se uma verificação manual das sequências marcadas como não sendo de confiança. No final, de um total de 3058867 sequências de 182 organismos, foram identificadas mais de cinco mil sequências em 182 organismos. O conjunto destes dados permitiu uma análise preliminar de características particulares de proteínas rabs e a predição do conjunto de rabs do ancestral comum dos eucariotas. Os resultados obtidos foram disponibilizados no website Tra_cDB (http://www.igc.pt/tra_cdb). Este foi desenvolvido utilizando um back-end escrito em Python com base na web framework Django. A presença de citoesqueleto é outra característica que distingue eucariotas de procariotas. O citoesqueleto é composto por filamentos de actina, filamentos intermédios e microtúbulos. Estes últimos podem criar estruturas do tipo centriolar que são responsáveis por processos essenciais ao bom funcionamento da célula. Por exemplo, o centrosoma actua na segregação de cromossomas durante a divisão celular e tem no seu âmago um par de centríolos. Outras estruturas deste tipo incluem flagelos e cílios, que nucleiam protusões da membrana celular e permitem à célula mover-se ou sentir o ambiente envolvente. Estruturas centriolares aparecem em todos os principais grupos de eucariotas. Assim, como o sistema de transporte vesicular, postula-se que tenham origem num ancestral comum a todos os eucariotas. Mais uma vez, o estudo da evolução de uma estrutura ancestral poderá conduzir a uma melhor compreensão dos sistemas biológicos actuais. Há descrições de variações do esquema de organização destas estruturas, mas esta variabilidade, essencial para um estudo aprofundado da sua evolução, não se encontra catalogado nem centralizado. O objectivo deste trabalho é a criação de uma interface web, chamada CentrioleDB, para a anotação de imagens de microscopia electrónica de estruturas centriolares. Esta anotação é feita manualmente utilizando um dicionário controlado desenvolvido por especialistas no estudo destas estruturas. Para além de possibilitar a anotação de imagens, a CentrioleDB também permite a visualização de imagens já anotadas num contexto taxonómico e molecular. Um utilizador pode rapidamente descobrir em que organismos é que uma determinada estrutura aparece, que proteínas foram experimentalmente mapeadas nessa estrutura e quais os seus ortólogos. Esta é a primeira fase de um projecto de colaboração com grupos ligados à comunidade centriolar. Á medida que os dados de anotação ficam mais completos, poderemos comparar perfis de estruturas e moléculas e fazer previsões sobre que moléculas têm funções relacionadas com estas estruturas. A implementação da CentrioleDB foi feita utilizando uma base de dados relacional e a web framework Django. Foi necessário desenvolver: _ uma estrutura de base de dados que aceite facilmente mudanças e acrescentos ao dicionário controlado de anotação, uma vez que este encontra-se em permanente desenvolvimento e actualização por peritos na área. _ um backend que lida com o upload deficheiros de imagens e mantém a ligação entre estas e as respectivas anotações. _ uma interface que permita a anotação e a visualização de informação de uma forma intuitiva para o utilizador. Neste momento a CentrioleDB encontra-se em funcionamento em http://www.igc.pt/centrioledb e disponível a um grupo restrito de utilizadores por razões de copyright. As duas ferramentas aqui descritas têm em comum o facto de propiciarem às respectivas comunidades um local dedicado ao estudo da evolução dos respectivos sistemas. A integração de informação relevante com taxonomia contextualiza-a de uma forma que facilita uma visão global e abrangente da evolução destes sistemas essenciais a todos os eucariotas.
publishDate 2009
dc.date.none.fl_str_mv 2009
2009-01-01T00:00:00Z
2010-01-25T10:00:48Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/13855
url http://hdl.handle.net/10451/13855
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134257104289792