Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data

Detalhes bibliográficos
Autor(a) principal: Salgueiro, Helena Sofia Fernandes
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.5/27951
Resumo: Dissertação de Mestrado Integrado em Medicina Veterinária, área científica de Sanidade Animal
id RCAP_740ad8ba037f35a63e5ee5d772a52a69
oai_identifier_str oai:www.repository.utl.pt:10400.5/27951
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic dataRandom forestMachine learningMetagenómicaResistência aos antimicrobianosRandom forestMachine learningMetagenomicsAntimicrobial resistanceDissertação de Mestrado Integrado em Medicina Veterinária, área científica de Sanidade AnimalABSTRACT- Metagenomic data has been increasingly used in antimicrobial resistance (AMR) studies, but there is still a need for accurate and reliable methods for predicting the relative attribution of AMR determinants to different animal reservoirs. AMR data availability has increased exponentially over the past few years, as has global awareness of the threat that AMR poses to public health, often known as the silent pandemic. This has led to an upsurge in interest in applying machine learning to AMR data. In this study, shot-gun sequences were used from fecal samples of pigs, broilers, turkeys, and veal calves, previously collected during national cross-sectional studies across Europe. The data used in this study corresponded to these samples and their associated relative abundance of AMR determinants. A random forest (RF) model was developed to investigate the relative attribution of AMR determinants to those different reservoirs. Additionally, a descriptive analysis was made to further investigate the 15 most important variables for the RF model. A principal component analysis (PCA) and all-subsets regression were performed to identify reservoir-specific AMR determinants. Ultimately, the reservoir-specific AMR determinants identified here were compared with the resistome signatures identified in a previous study. The results demonstrated that the RF model successfully classified resistomes into corresponding reservoir classes, with high accuracy and reliability. The RF model had more difficulty differentiating pig from veal and broiler from turkey, indicating the similarity of resistome composition between each of these two species. The analyses validated several AMR determinants as resistome signatures of specific animal reservoirs, such as tet(40) and sul2 of veal, tet(Q), mef(A) and cfxA2 of veal and pig, blaTEM-126 of broiler, and tet(A) of broiler and turkey. This study describes a reliable and accurate method for the relative attribution of AMR determinants to different animal reservoirs using metagenomic data. Such results are essential for effective surveillance and control of AMR in animal and human populationsRESUMO - Validação de resistome-signatures através da aplicação de um algoritmo de previsão de machine learning em dados metagenómicos - Dados metagenómicos têm sido cada vez mais usados em estudos de resistência aos antimicrobianos, mas ainda há uma escassez de métodos precisos e fidedignos para prever a atribuição relativa de genes de resistência a diferentes espécies animais. A disponibilidade de dados de resistência aos antimicrobianos aumentou exponencialmente nos últimos anos, assim como a consciencialização global sobre a ameaça que as resistências representam para a saúde pública, geralmente conhecida como pandemia silenciosa. Isto levou a um aumento no interesse em aplicar métodos de machine learning a esses dados. Neste estudo, sequências shot-gun foram usadas a partir de amostras fecais de porcos, frangos, perús e vitelos, recolhidas anteriormente durante estudos nacionais por toda a Europa. Os dados utilizados neste estudo corresponderam a essas amostras e os seus valores FPKM associados. Um modelo de random forest (RF) foi desenvolvido para prever a atribuição relativa de gene de resistência para essas diferentes espécies. Além disso, uma análise descritiva foi feita para investigar melhor as 15 variáveis mais importantes para o modelo de RF. Uma análise de componentes principais (PCA) e regressão all-subsets foram realizadas para identificar genes de resistência específicos de certas espécies. Por fim, esses genes específicos aqui identificados foram comparados com os resistome-signatures identificados num estudo anterior. Os nossos resultados demonstraram que o modelo classificou com sucesso as amostras em classes de espécies correspondentes, com alta precisão e confiabilidade. O modelo teve mais dificuldade em diferenciar porco de vitela, e frango de perú, indicando uma semelhança da composição do resistoma entre cada uma dessas duas espécies. Esta análise validou vários genes como resistome-signatures de animais específicos, como tet(40) e sul2 de vitelos, tet(Q), mef(A) e cfxA2 de vitelos e porcos, blaTEM-126 de frangos, e tet(A) de frangos e perús. Este estudo descreve um método confiável e preciso para a atribuição relativa de genes de resistência a diferentes reservatórios animais usando dados metagenómicos. Estes resultados são essenciais para a vigilância e controlo das resistências aos antimicrobianos em populações animais e humanasUniversidade de Lisboa, Faculdade de Medicina VeterináriaDuarte, Ana Sofia RibeiroNunes, Telmo Renato Landeiro Raposo Pina (Tutor)Repositório da Universidade de LisboaSalgueiro, Helena Sofia Fernandes2023-06-26T10:27:55Z2023-05-252023-05-25T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.5/27951TID:203326172engSalgueiro HSF. 2023. Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data [dissertação de mestrado]. Lisboa: FMV-Universidade de Lisboainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-30T01:32:36Zoai:www.repository.utl.pt:10400.5/27951Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:02:14.639363Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data
title Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data
spellingShingle Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data
Salgueiro, Helena Sofia Fernandes
Random forest
Machine learning
Metagenómica
Resistência aos antimicrobianos
Random forest
Machine learning
Metagenomics
Antimicrobial resistance
title_short Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data
title_full Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data
title_fullStr Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data
title_full_unstemmed Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data
title_sort Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data
author Salgueiro, Helena Sofia Fernandes
author_facet Salgueiro, Helena Sofia Fernandes
author_role author
dc.contributor.none.fl_str_mv Duarte, Ana Sofia Ribeiro
Nunes, Telmo Renato Landeiro Raposo Pina (Tutor)
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Salgueiro, Helena Sofia Fernandes
dc.subject.por.fl_str_mv Random forest
Machine learning
Metagenómica
Resistência aos antimicrobianos
Random forest
Machine learning
Metagenomics
Antimicrobial resistance
topic Random forest
Machine learning
Metagenómica
Resistência aos antimicrobianos
Random forest
Machine learning
Metagenomics
Antimicrobial resistance
description Dissertação de Mestrado Integrado em Medicina Veterinária, área científica de Sanidade Animal
publishDate 2023
dc.date.none.fl_str_mv 2023-06-26T10:27:55Z
2023-05-25
2023-05-25T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.5/27951
TID:203326172
url http://hdl.handle.net/10400.5/27951
identifier_str_mv TID:203326172
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv Salgueiro HSF. 2023. Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data [dissertação de mestrado]. Lisboa: FMV-Universidade de Lisboa
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade de Lisboa, Faculdade de Medicina Veterinária
publisher.none.fl_str_mv Universidade de Lisboa, Faculdade de Medicina Veterinária
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799131688454848512