NGSOnto: proposta de uma ontologia para descrever o processo de sequenciação de alto desempenho

Detalhes bibliográficos
Autor(a) principal: Silva, Mickael Santos da
Data de Publicação: 2014
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/12157
Resumo: Tese de mestrado em Bioinformática e Biologia Computacional (Bioinformática), apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2014
id RCAP_0f7a4a27e119c231916c67be31ec4e7a
oai_identifier_str oai:repositorio.ul.pt:10451/12157
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling NGSOnto: proposta de uma ontologia para descrever o processo de sequenciação de alto desempenhoOntologiasSequenciação do genoma completoServiço Web RESTFulMétodos de tipagem microbianaTeses de mestrado - 2014Tese de mestrado em Bioinformática e Biologia Computacional (Bioinformática), apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2014Com o aparecimento dos novos métodos de sequenciação de alto desempenho, tem-se verificado uma diminuição de custos na sequenciação em larga escala de genomas através da tecnologia denominada de “Next Generation Sequencing” (NGS), resultado numa cada vez maior produção de informação genómica. Um dos campos onde a aplicação destas novas tecnologias de sequenciação, têm provas dadas de sucesso é em Epidemiologia Molecular, cujo objectivo é detectar e seguir surtos bacterianos. Casos recentes e mediáticos de surtos de estirpes bacterianas perigosas para a saúde pública, como o surto de cólera em 2010 no Haiti e E.coli O104:H4 na Alemanha em 2011, têm revelado as competências das tecnologias NGS relativamente às tecnicas de tipagem até então utilizadas. No entanto para os dados serem comparáveis e reprodutíveis, todo o processo desde a extração do DNA até há analise final de resultados necessitam de ser documentados. Até ao momento, os principais serviços de pesquisa e inserção de dados de NGS, como o Sequence Read Archive (SRA) e European Nucleotide Archive (ENA), apresentam algumas limitações, nomeadamente no que se refere à anotação dos processos laboratoriais e em processos de analise in silico dos dados. Neste trabalho foi desenvolvida uma ontologia relacionado com a sequenciação de nova geração, a NGSOnto. Esta ontologia foi construida de forma a descrever o fluxo de trabalho de um processo de sequenciação por NGS, sendo que esta ontologia reutiliza conceitos da Ontology for Biomedical Investigation (OBI) entre outras. Para construir a ontologia foi utilizada a Web Ontology Language (OWL), utilizando a estrutura da Basic Formal Ontology (BFO) 1.1 e guardando a informação através da Resource Description Framework (RDF). Foi também criada, como prova de conceito de aplicação da ontologia, uma interface programática REST de modo a possibilitar a inserção e consulta de dados num formato que sejam possíveis de ser lidos por máquinas , e uma interface web de fácil utilização para clientes com menos conhecimentos programáticos, que utiliza a REST API desenvolvida. Com a anotação dos dados usando a NGSOnto, a captura do fluxo de trabalho de todos os processos envolvidos permite assegurar a reprodutibilidade de todo o processo através da utilização um vocabulário controlado e especifico para o campo, com benefícios óbvios para investigação em diversas áreas que usam NGS e para validação e certificação de resultados em aplicações clinicas.With the appearance of new high throughput sequencing tecnologies, there has been a significant decrease in large scale sequencing costs through technologies known as "Next Generation Sequencing"(NGS), resulting in an increasing genomic information production. One of the successful application fields of this new sequencing technologies has been the Molecular Epidemology, where the main aim is at detecting and following bacterian outbreaks. Recent and known cases of such outbreaks where NGS technologies have proven their capacity, comparing with previous typing methods, are the cholera outbreak in 2010 at Haiti and the E.coli O104:H4 at Germany in 2011. However, to be able to compare and reproduce this data, it's necessary to keep the information of all processes, starting at the DNA Extraction process until the last final results analysis. At this moment, the main NGS data search and insertion services, such as o Sequence Read Archive (SRA) and European Nucleotide Archive (ENA), present some limitations, namely at the annotation of performed laboratorial processes and consequent in silico data analysis processes. Considering the previous facts, an ontology about the new sequencing generation was developed, the NGSOnto. This ontology was developed in order to describe the full workflow of a NGS sequencing process, reusing concepts of the Ontology for Biomedical Investigation (OBI) and others. The Web Ontology Language (OWL) was used to develop the NGSOnto, using the Basic Formal Ontology (BFO) 1.1 high level structure and saving the data trough the Resource Description Framework (RDF). In order to perform a concept proof of case of the NGSOnto, a REST Application Programming Interface (API) was developed, providing a mean to insert and access the data in a machine readable format, and a web interface, that uses the REST API developed, for users with less programatic skills. Using NGSOnto, the capture of all the workflow process information provides a mean to ensure the reproducibility of the NGS process, through a controled and domain specific vocabulary, providing obvious benefits for scientific investigation areas using NGS technologies and certification of clinical results.Carriço, João André Nogueira CustódioCouto, Francisco José MoreiraRepositório da Universidade de LisboaSilva, Mickael Santos da2014-10-01T14:54:23Z201420142014-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/12157TID:201346141porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T15:58:52Zoai:repositorio.ul.pt:10451/12157Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:35:37.151224Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv NGSOnto: proposta de uma ontologia para descrever o processo de sequenciação de alto desempenho
title NGSOnto: proposta de uma ontologia para descrever o processo de sequenciação de alto desempenho
spellingShingle NGSOnto: proposta de uma ontologia para descrever o processo de sequenciação de alto desempenho
Silva, Mickael Santos da
Ontologias
Sequenciação do genoma completo
Serviço Web RESTFul
Métodos de tipagem microbiana
Teses de mestrado - 2014
title_short NGSOnto: proposta de uma ontologia para descrever o processo de sequenciação de alto desempenho
title_full NGSOnto: proposta de uma ontologia para descrever o processo de sequenciação de alto desempenho
title_fullStr NGSOnto: proposta de uma ontologia para descrever o processo de sequenciação de alto desempenho
title_full_unstemmed NGSOnto: proposta de uma ontologia para descrever o processo de sequenciação de alto desempenho
title_sort NGSOnto: proposta de uma ontologia para descrever o processo de sequenciação de alto desempenho
author Silva, Mickael Santos da
author_facet Silva, Mickael Santos da
author_role author
dc.contributor.none.fl_str_mv Carriço, João André Nogueira Custódio
Couto, Francisco José Moreira
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Silva, Mickael Santos da
dc.subject.por.fl_str_mv Ontologias
Sequenciação do genoma completo
Serviço Web RESTFul
Métodos de tipagem microbiana
Teses de mestrado - 2014
topic Ontologias
Sequenciação do genoma completo
Serviço Web RESTFul
Métodos de tipagem microbiana
Teses de mestrado - 2014
description Tese de mestrado em Bioinformática e Biologia Computacional (Bioinformática), apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2014
publishDate 2014
dc.date.none.fl_str_mv 2014-10-01T14:54:23Z
2014
2014
2014-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/12157
TID:201346141
url http://hdl.handle.net/10451/12157
identifier_str_mv TID:201346141
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134255352119296