Extraction of phylogenomic information for the development of new approaches for geotraceability
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10451/37117 |
Resumo: | Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2018 |
id |
RCAP_958f31ba2c649783cf5872e0b58d6215 |
---|---|
oai_identifier_str |
oai:repositorio.ul.pt:10451/37117 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Extraction of phylogenomic information for the development of new approaches for geotraceabilityGeorrastreabilidadeSequenciação de Alto DébitoTransmissão EpidemiológicaSegurança alimentarTeses de mestrado - 2018Domínio/Área Científica::Ciências Naturais::Ciências BiológicasTese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2018Atualmente os consumidores têm ganho uma maior sensibilização face à autenticidade e origem dos produtos alimentares, apesar de a preocupação com a segurança alimentar também aumentar. A aplicação de novas metodologias como a implementação de sistemas de rastreabilidade, são o caminho a seguir para assegurar a autenticidade dos produtos alimentares. Os sistemas de rastreabilidade têm como objetivo proporcionar a capacidade de rastrear um produto desde a sua origem até às mãos do consumidor. Estes sistemas podem ser melhorados, integrando dados convencionais de rastreabilidade com outros domínios de dados, por exemplo, com dados geográficos ou topográficos. Portanto, a integração de dados convencionais de rastreabilidade com dados geográficos é referida como georrastreabilidade. Ao longo dos anos, várias ferramentas têm sido desenvolvidas para alcançar a integração dos domínios de dados referidos anteriormente, usando informações geradas por métodos microbiológicos convencionais e também pelas tecnologias de sequenciação de alto débito (vulgarmente referenciadas como Next Generation Sequencing ou NGS). Desde o seu desenvolvimento, as NGS têm gerado grandes volumes de dados, que se encontram disponíveis em repositórios públicos, permitindo aos utilizadores acederem e obterem dados genómicos curados necessários para o desenvolvimento de novas metodologias. Sendo assim, o objetivo principal do presente projeto trata-se do desenvolvimento de uma pipeline capaz de produzir informação filogenómica de microorganismos, a partir de dados obtidos por NGS, de modo a permitir a sua integração com dados geográficos. Esta integração permite gerar novos conhecimentos geofilogenómicos, permitindo novas abordagens para assegurar a rastreabilidade e a autenticidade. A pipeline desenvolvida obtém domínios de dados genómicos, geográficos e temporais, interrogando as bases de dados do National Center for Biotechnology (NCBI). Os dados genómicos são anotados e utilizados para efetuar a identificação do core genome e, em seguida, é efetuado core genome multi-locus sequence typing (cgMLST) para cada isolado. Após cgMLST, uma matriz de distâncias é gerada, seguida do cálculo da minimum spanning tree para a reconstrução das relações filogenómicas entre os isolados. A pipeline foi testada com 2 datasets distintos, contendo diferentes escalas geográficas e espécies de microorganismos. Os resultados sugerem que o método utilizado para a identificação de rotas de transmissão epidemiológicas putativas tem capacidade para discriminar casos epidemiologicamente relacionados, com diferentes escalas geográficas e espécies de microorganismos.The increasing awareness of consumers over food products’ authenticity has been steadily increasing throughout the years, despite the increased effort to improve food safety. These facts require the application of new techniques or methodologies to ease the rising concerns over authenticity. The application of traceability over food products in a distribution chain is one of said methodologies. The aim of traceability systems is to provide the ability to trace a product from its origin to the hands of the consumer. These systems can be further improved with the integration of other data domains such as geographical data or topographical data. Thus, the integration of conventional traceability data with geographical data is referred to as geotraceability. Over the years, tools have been developed to achieve the integration of the aforementioned data domains, using data generated by common microbiology methodologies and by Next Generation Sequencing (NGS) technologies, even though most of them only allow the visualization of multi-domain data. Since the development of NGS technologies, great volumes of data have been produced which are available for open use from several public repositories, allowing users to obtain curated genomic data necessary to develop new methodologies. Therefore, the main objective of this project is to develop a pipeline to produce phylogenomic information about food-borne pathogens, using NGS data, to integrate it with geographic data for the creation of novel geophylogenomic knowledge, useful for novel approaches for product traceability and authenticity. The developed pipeline performs user defined queries to databases of the National Center for Biotechnology (NCBI), retrieving genomic data (whole-genomes), geographical data (locations and coordinates) and temporal data (collection dates). The genomic data is annotated and used to perform the identification of the core genome, which will in turn, be used to perform core genome multi-locus sequence typing for every isolate. Afterwards, a distance matrix is generated, followed by the computation of a minimum spanning tree to reconstruct the phylogenomic relationships of the isolates. The pipeline was tested using 2 distinct datasets, differing in the geographic scale and pathogen species. The results suggest that the method used to identify putative transmission routes is able to discriminate epidemiologically connected episodes, with different geographical scale and pathogen.Dias, Ricardo Pedro MoreiraRepositório da Universidade de LisboaCerqueira, Pedro Rafael Vila2019-02-21T18:49:54Z201820182018-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/37117TID:202191346enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:34:08Zoai:repositorio.ul.pt:10451/37117Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:51:14.912505Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Extraction of phylogenomic information for the development of new approaches for geotraceability |
title |
Extraction of phylogenomic information for the development of new approaches for geotraceability |
spellingShingle |
Extraction of phylogenomic information for the development of new approaches for geotraceability Cerqueira, Pedro Rafael Vila Georrastreabilidade Sequenciação de Alto Débito Transmissão Epidemiológica Segurança alimentar Teses de mestrado - 2018 Domínio/Área Científica::Ciências Naturais::Ciências Biológicas |
title_short |
Extraction of phylogenomic information for the development of new approaches for geotraceability |
title_full |
Extraction of phylogenomic information for the development of new approaches for geotraceability |
title_fullStr |
Extraction of phylogenomic information for the development of new approaches for geotraceability |
title_full_unstemmed |
Extraction of phylogenomic information for the development of new approaches for geotraceability |
title_sort |
Extraction of phylogenomic information for the development of new approaches for geotraceability |
author |
Cerqueira, Pedro Rafael Vila |
author_facet |
Cerqueira, Pedro Rafael Vila |
author_role |
author |
dc.contributor.none.fl_str_mv |
Dias, Ricardo Pedro Moreira Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Cerqueira, Pedro Rafael Vila |
dc.subject.por.fl_str_mv |
Georrastreabilidade Sequenciação de Alto Débito Transmissão Epidemiológica Segurança alimentar Teses de mestrado - 2018 Domínio/Área Científica::Ciências Naturais::Ciências Biológicas |
topic |
Georrastreabilidade Sequenciação de Alto Débito Transmissão Epidemiológica Segurança alimentar Teses de mestrado - 2018 Domínio/Área Científica::Ciências Naturais::Ciências Biológicas |
description |
Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2018 |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018 2018 2018-01-01T00:00:00Z 2019-02-21T18:49:54Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10451/37117 TID:202191346 |
url |
http://hdl.handle.net/10451/37117 |
identifier_str_mv |
TID:202191346 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134448257597440 |