Extraction of phylogenomic information for the development of new approaches for geotraceability

Detalhes bibliográficos
Autor(a) principal: Cerqueira, Pedro Rafael Vila
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/37117
Resumo: Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2018
id RCAP_958f31ba2c649783cf5872e0b58d6215
oai_identifier_str oai:repositorio.ul.pt:10451/37117
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Extraction of phylogenomic information for the development of new approaches for geotraceabilityGeorrastreabilidadeSequenciação de Alto DébitoTransmissão EpidemiológicaSegurança alimentarTeses de mestrado - 2018Domínio/Área Científica::Ciências Naturais::Ciências BiológicasTese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2018Atualmente os consumidores têm ganho uma maior sensibilização face à autenticidade e origem dos produtos alimentares, apesar de a preocupação com a segurança alimentar também aumentar. A aplicação de novas metodologias como a implementação de sistemas de rastreabilidade, são o caminho a seguir para assegurar a autenticidade dos produtos alimentares. Os sistemas de rastreabilidade têm como objetivo proporcionar a capacidade de rastrear um produto desde a sua origem até às mãos do consumidor. Estes sistemas podem ser melhorados, integrando dados convencionais de rastreabilidade com outros domínios de dados, por exemplo, com dados geográficos ou topográficos. Portanto, a integração de dados convencionais de rastreabilidade com dados geográficos é referida como georrastreabilidade. Ao longo dos anos, várias ferramentas têm sido desenvolvidas para alcançar a integração dos domínios de dados referidos anteriormente, usando informações geradas por métodos microbiológicos convencionais e também pelas tecnologias de sequenciação de alto débito (vulgarmente referenciadas como Next Generation Sequencing ou NGS). Desde o seu desenvolvimento, as NGS têm gerado grandes volumes de dados, que se encontram disponíveis em repositórios públicos, permitindo aos utilizadores acederem e obterem dados genómicos curados necessários para o desenvolvimento de novas metodologias. Sendo assim, o objetivo principal do presente projeto trata-se do desenvolvimento de uma pipeline capaz de produzir informação filogenómica de microorganismos, a partir de dados obtidos por NGS, de modo a permitir a sua integração com dados geográficos. Esta integração permite gerar novos conhecimentos geofilogenómicos, permitindo novas abordagens para assegurar a rastreabilidade e a autenticidade. A pipeline desenvolvida obtém domínios de dados genómicos, geográficos e temporais, interrogando as bases de dados do National Center for Biotechnology (NCBI). Os dados genómicos são anotados e utilizados para efetuar a identificação do core genome e, em seguida, é efetuado core genome multi-locus sequence typing (cgMLST) para cada isolado. Após cgMLST, uma matriz de distâncias é gerada, seguida do cálculo da minimum spanning tree para a reconstrução das relações filogenómicas entre os isolados. A pipeline foi testada com 2 datasets distintos, contendo diferentes escalas geográficas e espécies de microorganismos. Os resultados sugerem que o método utilizado para a identificação de rotas de transmissão epidemiológicas putativas tem capacidade para discriminar casos epidemiologicamente relacionados, com diferentes escalas geográficas e espécies de microorganismos.The increasing awareness of consumers over food products’ authenticity has been steadily increasing throughout the years, despite the increased effort to improve food safety. These facts require the application of new techniques or methodologies to ease the rising concerns over authenticity. The application of traceability over food products in a distribution chain is one of said methodologies. The aim of traceability systems is to provide the ability to trace a product from its origin to the hands of the consumer. These systems can be further improved with the integration of other data domains such as geographical data or topographical data. Thus, the integration of conventional traceability data with geographical data is referred to as geotraceability. Over the years, tools have been developed to achieve the integration of the aforementioned data domains, using data generated by common microbiology methodologies and by Next Generation Sequencing (NGS) technologies, even though most of them only allow the visualization of multi-domain data. Since the development of NGS technologies, great volumes of data have been produced which are available for open use from several public repositories, allowing users to obtain curated genomic data necessary to develop new methodologies. Therefore, the main objective of this project is to develop a pipeline to produce phylogenomic information about food-borne pathogens, using NGS data, to integrate it with geographic data for the creation of novel geophylogenomic knowledge, useful for novel approaches for product traceability and authenticity. The developed pipeline performs user defined queries to databases of the National Center for Biotechnology (NCBI), retrieving genomic data (whole-genomes), geographical data (locations and coordinates) and temporal data (collection dates). The genomic data is annotated and used to perform the identification of the core genome, which will in turn, be used to perform core genome multi-locus sequence typing for every isolate. Afterwards, a distance matrix is generated, followed by the computation of a minimum spanning tree to reconstruct the phylogenomic relationships of the isolates. The pipeline was tested using 2 distinct datasets, differing in the geographic scale and pathogen species. The results suggest that the method used to identify putative transmission routes is able to discriminate epidemiologically connected episodes, with different geographical scale and pathogen.Dias, Ricardo Pedro MoreiraRepositório da Universidade de LisboaCerqueira, Pedro Rafael Vila2019-02-21T18:49:54Z201820182018-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/37117TID:202191346enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:34:08Zoai:repositorio.ul.pt:10451/37117Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:51:14.912505Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Extraction of phylogenomic information for the development of new approaches for geotraceability
title Extraction of phylogenomic information for the development of new approaches for geotraceability
spellingShingle Extraction of phylogenomic information for the development of new approaches for geotraceability
Cerqueira, Pedro Rafael Vila
Georrastreabilidade
Sequenciação de Alto Débito
Transmissão Epidemiológica
Segurança alimentar
Teses de mestrado - 2018
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
title_short Extraction of phylogenomic information for the development of new approaches for geotraceability
title_full Extraction of phylogenomic information for the development of new approaches for geotraceability
title_fullStr Extraction of phylogenomic information for the development of new approaches for geotraceability
title_full_unstemmed Extraction of phylogenomic information for the development of new approaches for geotraceability
title_sort Extraction of phylogenomic information for the development of new approaches for geotraceability
author Cerqueira, Pedro Rafael Vila
author_facet Cerqueira, Pedro Rafael Vila
author_role author
dc.contributor.none.fl_str_mv Dias, Ricardo Pedro Moreira
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Cerqueira, Pedro Rafael Vila
dc.subject.por.fl_str_mv Georrastreabilidade
Sequenciação de Alto Débito
Transmissão Epidemiológica
Segurança alimentar
Teses de mestrado - 2018
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
topic Georrastreabilidade
Sequenciação de Alto Débito
Transmissão Epidemiológica
Segurança alimentar
Teses de mestrado - 2018
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
description Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2018
publishDate 2018
dc.date.none.fl_str_mv 2018
2018
2018-01-01T00:00:00Z
2019-02-21T18:49:54Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/37117
TID:202191346
url http://hdl.handle.net/10451/37117
identifier_str_mv TID:202191346
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134448257597440