Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/55401 |
Resumo: | Arbovírus transmitidos por mosquitos apresentam grandes desafios para a saúde pública, sendo responsáveis por epidemias, que causam significativos impactos no sistema de saúde dos países onde ocorrem, com um espectro diversificado de afecções clínicas. Dentre os arbovírus, os vírus da febre amarela e da dengue são de interesse especial em território brasileiro. O vírus da febre amarela é responsável pela doença mais severa transmitida por mosquitos nos trópicos, sendo que o Brasil enfrentou surtos recentes com altas taxas de mortalidade, em áreas onde o vírus não era reportado há décadas. Esses locais consistem em regiões urbanas densamente povoadas com grande prevalência de pessoas não vacinadas. O vírus da dengue, por sua vez, é uma ameaça que põe em risco um terço da população global, especialmente em locais onde seu principal vetor, mosquitos do gênero Aedes, é mais prevalente. No Brasil, especificamente, diferentes sorotipos vêm causando grandes surtos nas últimas décadas, de modo que a vigilância genômica desponta como importante medida de detecção precoce de vírus emergente e reemergentes, assim como para a investigação do seu comportamento dinâmico e disseminação. Nesse contexto, ferramentas de análise de dados baseadas em aprendizado de máquina mostram-se capazes de extrair informações úteis de grandes volumes de dados e auxiliar nos objetivos da vigilância genômica. Nos trabalhos aqui apresentados, analisamos sequências genômicas completas e quase completas de vírus da febre amarela e da dengue, associados a dados clínicos, laboratoriais, epidemiológicos, geográficos e temporais, no intuito de identificar assinaturas genéticas correlacionadas a características biológicas observadas. Como resultado, identificamos variações nucleotídicas não sinônimas associadas ao “cycle threshold” de amostras de febre amarela de primatas não humanos e à severidade de infecções por febre amarela em humanos, para as quais realizamos modelagem proteica estrutural in-silico e discutimos possíveis implicações biológicas. Além disso, identificamos também assinaturas genéticas que diferenciam duas linhagens de vírus da dengue do sorotipo 2 em um surto recente no Brasil, destacando a complementaridade e a concordância do método com a análise filogenética. Sendo assim, este trabalho apresenta uma abordagem inicial, versátil e rápida, para auxiliar a vigilância genômica em tempo real. |
id |
UFMG_0a5cd963f61584b77c35a2614117f475 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/55401 |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Luiz Carlos Júnior Alcantarahttp://lattes.cnpq.br/7428560072021675http://lattes.cnpq.br/2190589411553276Álvaro Salgado de Abreu2023-06-27T15:07:48Z2023-06-27T15:07:48Z2022-06-14http://hdl.handle.net/1843/55401Arbovírus transmitidos por mosquitos apresentam grandes desafios para a saúde pública, sendo responsáveis por epidemias, que causam significativos impactos no sistema de saúde dos países onde ocorrem, com um espectro diversificado de afecções clínicas. Dentre os arbovírus, os vírus da febre amarela e da dengue são de interesse especial em território brasileiro. O vírus da febre amarela é responsável pela doença mais severa transmitida por mosquitos nos trópicos, sendo que o Brasil enfrentou surtos recentes com altas taxas de mortalidade, em áreas onde o vírus não era reportado há décadas. Esses locais consistem em regiões urbanas densamente povoadas com grande prevalência de pessoas não vacinadas. O vírus da dengue, por sua vez, é uma ameaça que põe em risco um terço da população global, especialmente em locais onde seu principal vetor, mosquitos do gênero Aedes, é mais prevalente. No Brasil, especificamente, diferentes sorotipos vêm causando grandes surtos nas últimas décadas, de modo que a vigilância genômica desponta como importante medida de detecção precoce de vírus emergente e reemergentes, assim como para a investigação do seu comportamento dinâmico e disseminação. Nesse contexto, ferramentas de análise de dados baseadas em aprendizado de máquina mostram-se capazes de extrair informações úteis de grandes volumes de dados e auxiliar nos objetivos da vigilância genômica. Nos trabalhos aqui apresentados, analisamos sequências genômicas completas e quase completas de vírus da febre amarela e da dengue, associados a dados clínicos, laboratoriais, epidemiológicos, geográficos e temporais, no intuito de identificar assinaturas genéticas correlacionadas a características biológicas observadas. Como resultado, identificamos variações nucleotídicas não sinônimas associadas ao “cycle threshold” de amostras de febre amarela de primatas não humanos e à severidade de infecções por febre amarela em humanos, para as quais realizamos modelagem proteica estrutural in-silico e discutimos possíveis implicações biológicas. Além disso, identificamos também assinaturas genéticas que diferenciam duas linhagens de vírus da dengue do sorotipo 2 em um surto recente no Brasil, destacando a complementaridade e a concordância do método com a análise filogenética. Sendo assim, este trabalho apresenta uma abordagem inicial, versátil e rápida, para auxiliar a vigilância genômica em tempo real.Arboviruses transmitted by mosquitoes present major challenges for public health and are responsible for epidemics which cause significant impacts on the health system of the countries where they occur, with a diverse spectrum of clinical conditions. Among them, yellow fever and dengue viruses are of special interest in the Brazilian territory. Yellow fever virus is responsible for the most severe disease transmitted by mosquitoes in the tropics, and Brazil has faced recent outbreaks with high mortality rates in areas where the virus had not been reported for decades. These sites consist of densely populated urban regions with a high prevalence of unvaccinated people. Dengue virus, in turn, is a threat that puts a third of the global population at risk, especially in places where its main vector, mosquitoes of the Aedes genus, is more prevalent. In Brazil, specifically, different serotypes have caused major outbreaks in recent decades, so that genomic surveillance comes up as an important measure for early detection of emerging and reemerging viruses, as well as for investigating their dynamic behavior and dissemination. In this context, data analysis tools based on machine learning are able to extract useful information from large volumes of data and assist in the objectives of genomic surveillance. In the work presented here, we analyzed complete and almost complete genomic sequences of yellow fever and dengue viruses, associated with clinical, laboratory, epidemiological, geographic and temporal data, in order to identify genetic signatures correlated with observed biological characteristics. As a result, we identified non-synonymous nucleotide variations associated with the cycle threshold of yellow fever samples from non-human primates and the severity of yellow fever infections in humans, for which we performed in-silico structural protein modeling and discussed possible biological implications. In addition, we also identified genetic signatures that differentiate strains of dengue virus serotype 2 in a recent outbreak in Brazil, highlighting the method’s complementarity and accordance to phylogenetic analysis. Therefore, this work presents an initial, versatile and fast approach to assist in real-time genomic surveillance.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de Minas GeraisPrograma de Pós-Graduação em BioinformaticaUFMGBrasilICB - INSTITUTO DE CIÊNCIAS BIOLOGICASBioinformáticaAprendizado de MáquinaGenômicaInteligência ArtificialVírus da Febre AmarelaVírus da Dengueaprendizado de máquinavigilância genômicaAprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALtese_alvaro_rev16_posdefesa.pdftese_alvaro_rev16_posdefesa.pdfapplication/pdf3165604https://repositorio.ufmg.br/bitstream/1843/55401/2/tese_alvaro_rev16_posdefesa.pdff18c409ccc42e463e289d6fdd08a4facMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82118https://repositorio.ufmg.br/bitstream/1843/55401/3/license.txtcda590c95a0b51b4d15f60c9642ca272MD531843/554012023-06-27 12:07:48.564oai:repositorio.ufmg.br:1843/55401TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2023-06-27T15:07:48Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes |
title |
Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes |
spellingShingle |
Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes Álvaro Salgado de Abreu aprendizado de máquina vigilância genômica Bioinformática Aprendizado de Máquina Genômica Inteligência Artificial Vírus da Febre Amarela Vírus da Dengue |
title_short |
Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes |
title_full |
Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes |
title_fullStr |
Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes |
title_full_unstemmed |
Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes |
title_sort |
Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes |
author |
Álvaro Salgado de Abreu |
author_facet |
Álvaro Salgado de Abreu |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Luiz Carlos Júnior Alcantara |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/7428560072021675 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/2190589411553276 |
dc.contributor.author.fl_str_mv |
Álvaro Salgado de Abreu |
contributor_str_mv |
Luiz Carlos Júnior Alcantara |
dc.subject.por.fl_str_mv |
aprendizado de máquina vigilância genômica |
topic |
aprendizado de máquina vigilância genômica Bioinformática Aprendizado de Máquina Genômica Inteligência Artificial Vírus da Febre Amarela Vírus da Dengue |
dc.subject.other.pt_BR.fl_str_mv |
Bioinformática Aprendizado de Máquina Genômica Inteligência Artificial Vírus da Febre Amarela Vírus da Dengue |
description |
Arbovírus transmitidos por mosquitos apresentam grandes desafios para a saúde pública, sendo responsáveis por epidemias, que causam significativos impactos no sistema de saúde dos países onde ocorrem, com um espectro diversificado de afecções clínicas. Dentre os arbovírus, os vírus da febre amarela e da dengue são de interesse especial em território brasileiro. O vírus da febre amarela é responsável pela doença mais severa transmitida por mosquitos nos trópicos, sendo que o Brasil enfrentou surtos recentes com altas taxas de mortalidade, em áreas onde o vírus não era reportado há décadas. Esses locais consistem em regiões urbanas densamente povoadas com grande prevalência de pessoas não vacinadas. O vírus da dengue, por sua vez, é uma ameaça que põe em risco um terço da população global, especialmente em locais onde seu principal vetor, mosquitos do gênero Aedes, é mais prevalente. No Brasil, especificamente, diferentes sorotipos vêm causando grandes surtos nas últimas décadas, de modo que a vigilância genômica desponta como importante medida de detecção precoce de vírus emergente e reemergentes, assim como para a investigação do seu comportamento dinâmico e disseminação. Nesse contexto, ferramentas de análise de dados baseadas em aprendizado de máquina mostram-se capazes de extrair informações úteis de grandes volumes de dados e auxiliar nos objetivos da vigilância genômica. Nos trabalhos aqui apresentados, analisamos sequências genômicas completas e quase completas de vírus da febre amarela e da dengue, associados a dados clínicos, laboratoriais, epidemiológicos, geográficos e temporais, no intuito de identificar assinaturas genéticas correlacionadas a características biológicas observadas. Como resultado, identificamos variações nucleotídicas não sinônimas associadas ao “cycle threshold” de amostras de febre amarela de primatas não humanos e à severidade de infecções por febre amarela em humanos, para as quais realizamos modelagem proteica estrutural in-silico e discutimos possíveis implicações biológicas. Além disso, identificamos também assinaturas genéticas que diferenciam duas linhagens de vírus da dengue do sorotipo 2 em um surto recente no Brasil, destacando a complementaridade e a concordância do método com a análise filogenética. Sendo assim, este trabalho apresenta uma abordagem inicial, versátil e rápida, para auxiliar a vigilância genômica em tempo real. |
publishDate |
2022 |
dc.date.issued.fl_str_mv |
2022-06-14 |
dc.date.accessioned.fl_str_mv |
2023-06-27T15:07:48Z |
dc.date.available.fl_str_mv |
2023-06-27T15:07:48Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/55401 |
url |
http://hdl.handle.net/1843/55401 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Bioinformatica |
dc.publisher.initials.fl_str_mv |
UFMG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
ICB - INSTITUTO DE CIÊNCIAS BIOLOGICAS |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/55401/2/tese_alvaro_rev16_posdefesa.pdf https://repositorio.ufmg.br/bitstream/1843/55401/3/license.txt |
bitstream.checksum.fl_str_mv |
f18c409ccc42e463e289d6fdd08a4fac cda590c95a0b51b4d15f60c9642ca272 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589209012830208 |