Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B

Detalhes bibliográficos
Autor(a) principal: Barros, Cesar Borges
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRJ
Texto Completo: http://hdl.handle.net/11422/13240
Resumo: The development of coreceptor antagonists – such as maraviroc – for HIV treatment has made mandatory the clinical determination of viral coreceptor usage prior to rescue therapy. Technical issues presented by TrofileTM, the gold standard phenotypic assay, hindered its use as a routine diagnostic tool. This fact has lead to the development of genotypic algorithms, whose evaluations are based on DNA sequences of the V3 region of HIV-1 gp120. These algorithms proved to be cheaper, easier to use, and less time consuming than the phenotypic method. One of them, geno2pheno has also gained widespread use since it showed 86.5% predictive concordance with TrofileTM. The present project aimed to develop accurate classification models based on V3 sequence information. For this, 2,109 DNA sequences of V3 region from HIV-1 subtype B were used. Data labeled with geno2pheno’s results were then modeled by methods such as logistic regression, naive Bayes and random forest. All classifiers presented good predictive outputs, however random forest models showed the best discriminative performance, in the form of significant AUC results. These outcomes encourage us to continue the development of an easy to use and accurate algorithm for HIV-1 tropism diagnosis, capable of guiding clinical decision making regarding the use of coreceptor antagonists in HIV-1 treatment.
id UFRJ_99b0afdf5290217c17a3842cc1470f30
oai_identifier_str oai:pantheon.ufrj.br:11422/13240
network_acronym_str UFRJ
network_name_str Repositório Institucional da UFRJ
repository_id_str
spelling Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo BHIV-1 subtipo BTropismo viralClassificadores baseados em aprendizado de máquinaCNPQ::ENGENHARIASThe development of coreceptor antagonists – such as maraviroc – for HIV treatment has made mandatory the clinical determination of viral coreceptor usage prior to rescue therapy. Technical issues presented by TrofileTM, the gold standard phenotypic assay, hindered its use as a routine diagnostic tool. This fact has lead to the development of genotypic algorithms, whose evaluations are based on DNA sequences of the V3 region of HIV-1 gp120. These algorithms proved to be cheaper, easier to use, and less time consuming than the phenotypic method. One of them, geno2pheno has also gained widespread use since it showed 86.5% predictive concordance with TrofileTM. The present project aimed to develop accurate classification models based on V3 sequence information. For this, 2,109 DNA sequences of V3 region from HIV-1 subtype B were used. Data labeled with geno2pheno’s results were then modeled by methods such as logistic regression, naive Bayes and random forest. All classifiers presented good predictive outputs, however random forest models showed the best discriminative performance, in the form of significant AUC results. These outcomes encourage us to continue the development of an easy to use and accurate algorithm for HIV-1 tropism diagnosis, capable of guiding clinical decision making regarding the use of coreceptor antagonists in HIV-1 treatment.O desenvolvimento de antagonistas de correceptores – como o maraviroque – para o tratamento anti-HIV tornou mandatória a determinação clínica do tropismo viral previamente às terapias de resgate. Aspectos técnicos do TrofileTM, o ensaio fenotípico referencial, dificultaram o seu uso como ferramenta de rotina para este diagnóstico. Isto levou ao desenvolvimento de algoritmos genotípicos, cujas avaliações são baseadas em sequências genéticas da região V3 da gp120 do HIV-1. Tais algoritmos se mostraram opções menos dispensiosas de custo e tempo, além de serem mais práticos para o uso na rotina clínica do que o ensaio fenotípico. Dentre eles, o geno2pheno começou a ser amplamente utilizado após apresentar uma concordância preditiva de 86,5% com o TrofileTM. O presente projeto visou desenvolver modelos classificadores acurados, baseados em informações de sequências V3. Para isto, foram utilizadas 2.109 sequências de DNA da região V3 do HIV-1 de subtipo B. As sequências com os resultados do geno2pheno foram então modeladas pelos métodos de regressão logística, naive Bayes e random forest. Todos os classificadores apresentaram bons resultados preditivos, porém os modelos de random forest obtiveram o melhor desempenho discriminativo, sob a forma de resultados significativos de AUC. Tais resultados são encorajadores para a continuação do desenvolvimento de um algoritmo acurado e de uso prático para a predição clínica do tropismo viral, capaz de orientar a tomada de decisão em relação à utilização de antagonistas de correceptores no tratamento do HIV-1.Universidade Federal do Rio de JaneiroBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaPrograma de Pós-Graduação em Engenharia BiomédicaUFRJNobre, Flávio Fonsecahttp://lattes.cnpq.br/2953219280065235http://lattes.cnpq.br/907662689904722Almeida, Rosimary Terezinha deArruda, Monica BarcellosBarros, Cesar Borges2020-10-14T20:26:28Z2023-12-21T03:02:22Z2019-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/11422/13240porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJ2023-12-21T03:02:22Zoai:pantheon.ufrj.br:11422/13240Repositório InstitucionalPUBhttp://www.pantheon.ufrj.br/oai/requestpantheon@sibi.ufrj.bropendoar:2023-12-21T03:02:22Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false
dc.title.none.fl_str_mv Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B
title Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B
spellingShingle Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B
Barros, Cesar Borges
HIV-1 subtipo B
Tropismo viral
Classificadores baseados em aprendizado de máquina
CNPQ::ENGENHARIAS
title_short Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B
title_full Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B
title_fullStr Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B
title_full_unstemmed Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B
title_sort Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B
author Barros, Cesar Borges
author_facet Barros, Cesar Borges
author_role author
dc.contributor.none.fl_str_mv Nobre, Flávio Fonseca
http://lattes.cnpq.br/2953219280065235
http://lattes.cnpq.br/907662689904722
Almeida, Rosimary Terezinha de
Arruda, Monica Barcellos
dc.contributor.author.fl_str_mv Barros, Cesar Borges
dc.subject.por.fl_str_mv HIV-1 subtipo B
Tropismo viral
Classificadores baseados em aprendizado de máquina
CNPQ::ENGENHARIAS
topic HIV-1 subtipo B
Tropismo viral
Classificadores baseados em aprendizado de máquina
CNPQ::ENGENHARIAS
description The development of coreceptor antagonists – such as maraviroc – for HIV treatment has made mandatory the clinical determination of viral coreceptor usage prior to rescue therapy. Technical issues presented by TrofileTM, the gold standard phenotypic assay, hindered its use as a routine diagnostic tool. This fact has lead to the development of genotypic algorithms, whose evaluations are based on DNA sequences of the V3 region of HIV-1 gp120. These algorithms proved to be cheaper, easier to use, and less time consuming than the phenotypic method. One of them, geno2pheno has also gained widespread use since it showed 86.5% predictive concordance with TrofileTM. The present project aimed to develop accurate classification models based on V3 sequence information. For this, 2,109 DNA sequences of V3 region from HIV-1 subtype B were used. Data labeled with geno2pheno’s results were then modeled by methods such as logistic regression, naive Bayes and random forest. All classifiers presented good predictive outputs, however random forest models showed the best discriminative performance, in the form of significant AUC results. These outcomes encourage us to continue the development of an easy to use and accurate algorithm for HIV-1 tropism diagnosis, capable of guiding clinical decision making regarding the use of coreceptor antagonists in HIV-1 treatment.
publishDate 2019
dc.date.none.fl_str_mv 2019-03
2020-10-14T20:26:28Z
2023-12-21T03:02:22Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11422/13240
url http://hdl.handle.net/11422/13240
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
Brasil
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Programa de Pós-Graduação em Engenharia Biomédica
UFRJ
publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
Brasil
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Programa de Pós-Graduação em Engenharia Biomédica
UFRJ
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRJ
instname:Universidade Federal do Rio de Janeiro (UFRJ)
instacron:UFRJ
instname_str Universidade Federal do Rio de Janeiro (UFRJ)
instacron_str UFRJ
institution UFRJ
reponame_str Repositório Institucional da UFRJ
collection Repositório Institucional da UFRJ
repository.name.fl_str_mv Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)
repository.mail.fl_str_mv pantheon@sibi.ufrj.br
_version_ 1815456010600448000