Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.5/27951 |
Resumo: | Dissertação de Mestrado Integrado em Medicina Veterinária, área científica de Sanidade Animal |
id |
RCAP_740ad8ba037f35a63e5ee5d772a52a69 |
---|---|
oai_identifier_str |
oai:www.repository.utl.pt:10400.5/27951 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic dataRandom forestMachine learningMetagenómicaResistência aos antimicrobianosRandom forestMachine learningMetagenomicsAntimicrobial resistanceDissertação de Mestrado Integrado em Medicina Veterinária, área científica de Sanidade AnimalABSTRACT- Metagenomic data has been increasingly used in antimicrobial resistance (AMR) studies, but there is still a need for accurate and reliable methods for predicting the relative attribution of AMR determinants to different animal reservoirs. AMR data availability has increased exponentially over the past few years, as has global awareness of the threat that AMR poses to public health, often known as the silent pandemic. This has led to an upsurge in interest in applying machine learning to AMR data. In this study, shot-gun sequences were used from fecal samples of pigs, broilers, turkeys, and veal calves, previously collected during national cross-sectional studies across Europe. The data used in this study corresponded to these samples and their associated relative abundance of AMR determinants. A random forest (RF) model was developed to investigate the relative attribution of AMR determinants to those different reservoirs. Additionally, a descriptive analysis was made to further investigate the 15 most important variables for the RF model. A principal component analysis (PCA) and all-subsets regression were performed to identify reservoir-specific AMR determinants. Ultimately, the reservoir-specific AMR determinants identified here were compared with the resistome signatures identified in a previous study. The results demonstrated that the RF model successfully classified resistomes into corresponding reservoir classes, with high accuracy and reliability. The RF model had more difficulty differentiating pig from veal and broiler from turkey, indicating the similarity of resistome composition between each of these two species. The analyses validated several AMR determinants as resistome signatures of specific animal reservoirs, such as tet(40) and sul2 of veal, tet(Q), mef(A) and cfxA2 of veal and pig, blaTEM-126 of broiler, and tet(A) of broiler and turkey. This study describes a reliable and accurate method for the relative attribution of AMR determinants to different animal reservoirs using metagenomic data. Such results are essential for effective surveillance and control of AMR in animal and human populationsRESUMO - Validação de resistome-signatures através da aplicação de um algoritmo de previsão de machine learning em dados metagenómicos - Dados metagenómicos têm sido cada vez mais usados em estudos de resistência aos antimicrobianos, mas ainda há uma escassez de métodos precisos e fidedignos para prever a atribuição relativa de genes de resistência a diferentes espécies animais. A disponibilidade de dados de resistência aos antimicrobianos aumentou exponencialmente nos últimos anos, assim como a consciencialização global sobre a ameaça que as resistências representam para a saúde pública, geralmente conhecida como pandemia silenciosa. Isto levou a um aumento no interesse em aplicar métodos de machine learning a esses dados. Neste estudo, sequências shot-gun foram usadas a partir de amostras fecais de porcos, frangos, perús e vitelos, recolhidas anteriormente durante estudos nacionais por toda a Europa. Os dados utilizados neste estudo corresponderam a essas amostras e os seus valores FPKM associados. Um modelo de random forest (RF) foi desenvolvido para prever a atribuição relativa de gene de resistência para essas diferentes espécies. Além disso, uma análise descritiva foi feita para investigar melhor as 15 variáveis mais importantes para o modelo de RF. Uma análise de componentes principais (PCA) e regressão all-subsets foram realizadas para identificar genes de resistência específicos de certas espécies. Por fim, esses genes específicos aqui identificados foram comparados com os resistome-signatures identificados num estudo anterior. Os nossos resultados demonstraram que o modelo classificou com sucesso as amostras em classes de espécies correspondentes, com alta precisão e confiabilidade. O modelo teve mais dificuldade em diferenciar porco de vitela, e frango de perú, indicando uma semelhança da composição do resistoma entre cada uma dessas duas espécies. Esta análise validou vários genes como resistome-signatures de animais específicos, como tet(40) e sul2 de vitelos, tet(Q), mef(A) e cfxA2 de vitelos e porcos, blaTEM-126 de frangos, e tet(A) de frangos e perús. Este estudo descreve um método confiável e preciso para a atribuição relativa de genes de resistência a diferentes reservatórios animais usando dados metagenómicos. Estes resultados são essenciais para a vigilância e controlo das resistências aos antimicrobianos em populações animais e humanasUniversidade de Lisboa, Faculdade de Medicina VeterináriaDuarte, Ana Sofia RibeiroNunes, Telmo Renato Landeiro Raposo Pina (Tutor)Repositório da Universidade de LisboaSalgueiro, Helena Sofia Fernandes2023-06-26T10:27:55Z2023-05-252023-05-25T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.5/27951TID:203326172engSalgueiro HSF. 2023. Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data [dissertação de mestrado]. Lisboa: FMV-Universidade de Lisboainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-30T01:32:36Zoai:www.repository.utl.pt:10400.5/27951Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:02:14.639363Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data |
title |
Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data |
spellingShingle |
Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data Salgueiro, Helena Sofia Fernandes Random forest Machine learning Metagenómica Resistência aos antimicrobianos Random forest Machine learning Metagenomics Antimicrobial resistance |
title_short |
Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data |
title_full |
Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data |
title_fullStr |
Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data |
title_full_unstemmed |
Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data |
title_sort |
Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data |
author |
Salgueiro, Helena Sofia Fernandes |
author_facet |
Salgueiro, Helena Sofia Fernandes |
author_role |
author |
dc.contributor.none.fl_str_mv |
Duarte, Ana Sofia Ribeiro Nunes, Telmo Renato Landeiro Raposo Pina (Tutor) Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Salgueiro, Helena Sofia Fernandes |
dc.subject.por.fl_str_mv |
Random forest Machine learning Metagenómica Resistência aos antimicrobianos Random forest Machine learning Metagenomics Antimicrobial resistance |
topic |
Random forest Machine learning Metagenómica Resistência aos antimicrobianos Random forest Machine learning Metagenomics Antimicrobial resistance |
description |
Dissertação de Mestrado Integrado em Medicina Veterinária, área científica de Sanidade Animal |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-06-26T10:27:55Z 2023-05-25 2023-05-25T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.5/27951 TID:203326172 |
url |
http://hdl.handle.net/10400.5/27951 |
identifier_str_mv |
TID:203326172 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
Salgueiro HSF. 2023. Validation of resistome signatures through the application of a machine learning prediction algorithm on metagenomic data [dissertação de mestrado]. Lisboa: FMV-Universidade de Lisboa |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade de Lisboa, Faculdade de Medicina Veterinária |
publisher.none.fl_str_mv |
Universidade de Lisboa, Faculdade de Medicina Veterinária |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799131688454848512 |