Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes

Detalhes bibliográficos
Autor(a) principal: Álvaro Salgado de Abreu
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/55401
Resumo: Arbovírus transmitidos por mosquitos apresentam grandes desafios para a saúde pública, sendo responsáveis por epidemias, que causam significativos impactos no sistema de saúde dos países onde ocorrem, com um espectro diversificado de afecções clínicas. Dentre os arbovírus, os vírus da febre amarela e da dengue são de interesse especial em território brasileiro. O vírus da febre amarela é responsável pela doença mais severa transmitida por mosquitos nos trópicos, sendo que o Brasil enfrentou surtos recentes com altas taxas de mortalidade, em áreas onde o vírus não era reportado há décadas. Esses locais consistem em regiões urbanas densamente povoadas com grande prevalência de pessoas não vacinadas. O vírus da dengue, por sua vez, é uma ameaça que põe em risco um terço da população global, especialmente em locais onde seu principal vetor, mosquitos do gênero Aedes, é mais prevalente. No Brasil, especificamente, diferentes sorotipos vêm causando grandes surtos nas últimas décadas, de modo que a vigilância genômica desponta como importante medida de detecção precoce de vírus emergente e reemergentes, assim como para a investigação do seu comportamento dinâmico e disseminação. Nesse contexto, ferramentas de análise de dados baseadas em aprendizado de máquina mostram-se capazes de extrair informações úteis de grandes volumes de dados e auxiliar nos objetivos da vigilância genômica. Nos trabalhos aqui apresentados, analisamos sequências genômicas completas e quase completas de vírus da febre amarela e da dengue, associados a dados clínicos, laboratoriais, epidemiológicos, geográficos e temporais, no intuito de identificar assinaturas genéticas correlacionadas a características biológicas observadas. Como resultado, identificamos variações nucleotídicas não sinônimas associadas ao “cycle threshold” de amostras de febre amarela de primatas não humanos e à severidade de infecções por febre amarela em humanos, para as quais realizamos modelagem proteica estrutural in-silico e discutimos possíveis implicações biológicas. Além disso, identificamos também assinaturas genéticas que diferenciam duas linhagens de vírus da dengue do sorotipo 2 em um surto recente no Brasil, destacando a complementaridade e a concordância do método com a análise filogenética. Sendo assim, este trabalho apresenta uma abordagem inicial, versátil e rápida, para auxiliar a vigilância genômica em tempo real.
id UFMG_0a5cd963f61584b77c35a2614117f475
oai_identifier_str oai:repositorio.ufmg.br:1843/55401
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Luiz Carlos Júnior Alcantarahttp://lattes.cnpq.br/7428560072021675http://lattes.cnpq.br/2190589411553276Álvaro Salgado de Abreu2023-06-27T15:07:48Z2023-06-27T15:07:48Z2022-06-14http://hdl.handle.net/1843/55401Arbovírus transmitidos por mosquitos apresentam grandes desafios para a saúde pública, sendo responsáveis por epidemias, que causam significativos impactos no sistema de saúde dos países onde ocorrem, com um espectro diversificado de afecções clínicas. Dentre os arbovírus, os vírus da febre amarela e da dengue são de interesse especial em território brasileiro. O vírus da febre amarela é responsável pela doença mais severa transmitida por mosquitos nos trópicos, sendo que o Brasil enfrentou surtos recentes com altas taxas de mortalidade, em áreas onde o vírus não era reportado há décadas. Esses locais consistem em regiões urbanas densamente povoadas com grande prevalência de pessoas não vacinadas. O vírus da dengue, por sua vez, é uma ameaça que põe em risco um terço da população global, especialmente em locais onde seu principal vetor, mosquitos do gênero Aedes, é mais prevalente. No Brasil, especificamente, diferentes sorotipos vêm causando grandes surtos nas últimas décadas, de modo que a vigilância genômica desponta como importante medida de detecção precoce de vírus emergente e reemergentes, assim como para a investigação do seu comportamento dinâmico e disseminação. Nesse contexto, ferramentas de análise de dados baseadas em aprendizado de máquina mostram-se capazes de extrair informações úteis de grandes volumes de dados e auxiliar nos objetivos da vigilância genômica. Nos trabalhos aqui apresentados, analisamos sequências genômicas completas e quase completas de vírus da febre amarela e da dengue, associados a dados clínicos, laboratoriais, epidemiológicos, geográficos e temporais, no intuito de identificar assinaturas genéticas correlacionadas a características biológicas observadas. Como resultado, identificamos variações nucleotídicas não sinônimas associadas ao “cycle threshold” de amostras de febre amarela de primatas não humanos e à severidade de infecções por febre amarela em humanos, para as quais realizamos modelagem proteica estrutural in-silico e discutimos possíveis implicações biológicas. Além disso, identificamos também assinaturas genéticas que diferenciam duas linhagens de vírus da dengue do sorotipo 2 em um surto recente no Brasil, destacando a complementaridade e a concordância do método com a análise filogenética. Sendo assim, este trabalho apresenta uma abordagem inicial, versátil e rápida, para auxiliar a vigilância genômica em tempo real.Arboviruses transmitted by mosquitoes present major challenges for public health and are responsible for epidemics which cause significant impacts on the health system of the countries where they occur, with a diverse spectrum of clinical conditions. Among them, yellow fever and dengue viruses are of special interest in the Brazilian territory. Yellow fever virus is responsible for the most severe disease transmitted by mosquitoes in the tropics, and Brazil has faced recent outbreaks with high mortality rates in areas where the virus had not been reported for decades. These sites consist of densely populated urban regions with a high prevalence of unvaccinated people. Dengue virus, in turn, is a threat that puts a third of the global population at risk, especially in places where its main vector, mosquitoes of the Aedes genus, is more prevalent. In Brazil, specifically, different serotypes have caused major outbreaks in recent decades, so that genomic surveillance comes up as an important measure for early detection of emerging and reemerging viruses, as well as for investigating their dynamic behavior and dissemination. In this context, data analysis tools based on machine learning are able to extract useful information from large volumes of data and assist in the objectives of genomic surveillance. In the work presented here, we analyzed complete and almost complete genomic sequences of yellow fever and dengue viruses, associated with clinical, laboratory, epidemiological, geographic and temporal data, in order to identify genetic signatures correlated with observed biological characteristics. As a result, we identified non-synonymous nucleotide variations associated with the cycle threshold of yellow fever samples from non-human primates and the severity of yellow fever infections in humans, for which we performed in-silico structural protein modeling and discussed possible biological implications. In addition, we also identified genetic signatures that differentiate strains of dengue virus serotype 2 in a recent outbreak in Brazil, highlighting the method’s complementarity and accordance to phylogenetic analysis. Therefore, this work presents an initial, versatile and fast approach to assist in real-time genomic surveillance.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de Minas GeraisPrograma de Pós-Graduação em BioinformaticaUFMGBrasilICB - INSTITUTO DE CIÊNCIAS BIOLOGICASBioinformáticaAprendizado de MáquinaGenômicaInteligência ArtificialVírus da Febre AmarelaVírus da Dengueaprendizado de máquinavigilância genômicaAprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALtese_alvaro_rev16_posdefesa.pdftese_alvaro_rev16_posdefesa.pdfapplication/pdf3165604https://repositorio.ufmg.br/bitstream/1843/55401/2/tese_alvaro_rev16_posdefesa.pdff18c409ccc42e463e289d6fdd08a4facMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82118https://repositorio.ufmg.br/bitstream/1843/55401/3/license.txtcda590c95a0b51b4d15f60c9642ca272MD531843/554012023-06-27 12:07:48.564oai:repositorio.ufmg.br:1843/55401TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2023-06-27T15:07:48Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes
title Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes
spellingShingle Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes
Álvaro Salgado de Abreu
aprendizado de máquina
vigilância genômica
Bioinformática
Aprendizado de Máquina
Genômica
Inteligência Artificial
Vírus da Febre Amarela
Vírus da Dengue
title_short Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes
title_full Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes
title_fullStr Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes
title_full_unstemmed Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes
title_sort Aprendizado de máquina aplicado à vigilância genômica de vírus emergentes e reemergentes
author Álvaro Salgado de Abreu
author_facet Álvaro Salgado de Abreu
author_role author
dc.contributor.advisor1.fl_str_mv Luiz Carlos Júnior Alcantara
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/7428560072021675
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/2190589411553276
dc.contributor.author.fl_str_mv Álvaro Salgado de Abreu
contributor_str_mv Luiz Carlos Júnior Alcantara
dc.subject.por.fl_str_mv aprendizado de máquina
vigilância genômica
topic aprendizado de máquina
vigilância genômica
Bioinformática
Aprendizado de Máquina
Genômica
Inteligência Artificial
Vírus da Febre Amarela
Vírus da Dengue
dc.subject.other.pt_BR.fl_str_mv Bioinformática
Aprendizado de Máquina
Genômica
Inteligência Artificial
Vírus da Febre Amarela
Vírus da Dengue
description Arbovírus transmitidos por mosquitos apresentam grandes desafios para a saúde pública, sendo responsáveis por epidemias, que causam significativos impactos no sistema de saúde dos países onde ocorrem, com um espectro diversificado de afecções clínicas. Dentre os arbovírus, os vírus da febre amarela e da dengue são de interesse especial em território brasileiro. O vírus da febre amarela é responsável pela doença mais severa transmitida por mosquitos nos trópicos, sendo que o Brasil enfrentou surtos recentes com altas taxas de mortalidade, em áreas onde o vírus não era reportado há décadas. Esses locais consistem em regiões urbanas densamente povoadas com grande prevalência de pessoas não vacinadas. O vírus da dengue, por sua vez, é uma ameaça que põe em risco um terço da população global, especialmente em locais onde seu principal vetor, mosquitos do gênero Aedes, é mais prevalente. No Brasil, especificamente, diferentes sorotipos vêm causando grandes surtos nas últimas décadas, de modo que a vigilância genômica desponta como importante medida de detecção precoce de vírus emergente e reemergentes, assim como para a investigação do seu comportamento dinâmico e disseminação. Nesse contexto, ferramentas de análise de dados baseadas em aprendizado de máquina mostram-se capazes de extrair informações úteis de grandes volumes de dados e auxiliar nos objetivos da vigilância genômica. Nos trabalhos aqui apresentados, analisamos sequências genômicas completas e quase completas de vírus da febre amarela e da dengue, associados a dados clínicos, laboratoriais, epidemiológicos, geográficos e temporais, no intuito de identificar assinaturas genéticas correlacionadas a características biológicas observadas. Como resultado, identificamos variações nucleotídicas não sinônimas associadas ao “cycle threshold” de amostras de febre amarela de primatas não humanos e à severidade de infecções por febre amarela em humanos, para as quais realizamos modelagem proteica estrutural in-silico e discutimos possíveis implicações biológicas. Além disso, identificamos também assinaturas genéticas que diferenciam duas linhagens de vírus da dengue do sorotipo 2 em um surto recente no Brasil, destacando a complementaridade e a concordância do método com a análise filogenética. Sendo assim, este trabalho apresenta uma abordagem inicial, versátil e rápida, para auxiliar a vigilância genômica em tempo real.
publishDate 2022
dc.date.issued.fl_str_mv 2022-06-14
dc.date.accessioned.fl_str_mv 2023-06-27T15:07:48Z
dc.date.available.fl_str_mv 2023-06-27T15:07:48Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/55401
url http://hdl.handle.net/1843/55401
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Bioinformatica
dc.publisher.initials.fl_str_mv UFMG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv ICB - INSTITUTO DE CIÊNCIAS BIOLOGICAS
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/55401/2/tese_alvaro_rev16_posdefesa.pdf
https://repositorio.ufmg.br/bitstream/1843/55401/3/license.txt
bitstream.checksum.fl_str_mv f18c409ccc42e463e289d6fdd08a4fac
cda590c95a0b51b4d15f60c9642ca272
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589209012830208