Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRJ |
Texto Completo: | http://hdl.handle.net/11422/13240 |
Resumo: | The development of coreceptor antagonists – such as maraviroc – for HIV treatment has made mandatory the clinical determination of viral coreceptor usage prior to rescue therapy. Technical issues presented by TrofileTM, the gold standard phenotypic assay, hindered its use as a routine diagnostic tool. This fact has lead to the development of genotypic algorithms, whose evaluations are based on DNA sequences of the V3 region of HIV-1 gp120. These algorithms proved to be cheaper, easier to use, and less time consuming than the phenotypic method. One of them, geno2pheno has also gained widespread use since it showed 86.5% predictive concordance with TrofileTM. The present project aimed to develop accurate classification models based on V3 sequence information. For this, 2,109 DNA sequences of V3 region from HIV-1 subtype B were used. Data labeled with geno2pheno’s results were then modeled by methods such as logistic regression, naive Bayes and random forest. All classifiers presented good predictive outputs, however random forest models showed the best discriminative performance, in the form of significant AUC results. These outcomes encourage us to continue the development of an easy to use and accurate algorithm for HIV-1 tropism diagnosis, capable of guiding clinical decision making regarding the use of coreceptor antagonists in HIV-1 treatment. |
id |
UFRJ_99b0afdf5290217c17a3842cc1470f30 |
---|---|
oai_identifier_str |
oai:pantheon.ufrj.br:11422/13240 |
network_acronym_str |
UFRJ |
network_name_str |
Repositório Institucional da UFRJ |
repository_id_str |
|
spelling |
Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo BHIV-1 subtipo BTropismo viralClassificadores baseados em aprendizado de máquinaCNPQ::ENGENHARIASThe development of coreceptor antagonists – such as maraviroc – for HIV treatment has made mandatory the clinical determination of viral coreceptor usage prior to rescue therapy. Technical issues presented by TrofileTM, the gold standard phenotypic assay, hindered its use as a routine diagnostic tool. This fact has lead to the development of genotypic algorithms, whose evaluations are based on DNA sequences of the V3 region of HIV-1 gp120. These algorithms proved to be cheaper, easier to use, and less time consuming than the phenotypic method. One of them, geno2pheno has also gained widespread use since it showed 86.5% predictive concordance with TrofileTM. The present project aimed to develop accurate classification models based on V3 sequence information. For this, 2,109 DNA sequences of V3 region from HIV-1 subtype B were used. Data labeled with geno2pheno’s results were then modeled by methods such as logistic regression, naive Bayes and random forest. All classifiers presented good predictive outputs, however random forest models showed the best discriminative performance, in the form of significant AUC results. These outcomes encourage us to continue the development of an easy to use and accurate algorithm for HIV-1 tropism diagnosis, capable of guiding clinical decision making regarding the use of coreceptor antagonists in HIV-1 treatment.O desenvolvimento de antagonistas de correceptores – como o maraviroque – para o tratamento anti-HIV tornou mandatória a determinação clínica do tropismo viral previamente às terapias de resgate. Aspectos técnicos do TrofileTM, o ensaio fenotípico referencial, dificultaram o seu uso como ferramenta de rotina para este diagnóstico. Isto levou ao desenvolvimento de algoritmos genotípicos, cujas avaliações são baseadas em sequências genéticas da região V3 da gp120 do HIV-1. Tais algoritmos se mostraram opções menos dispensiosas de custo e tempo, além de serem mais práticos para o uso na rotina clínica do que o ensaio fenotípico. Dentre eles, o geno2pheno começou a ser amplamente utilizado após apresentar uma concordância preditiva de 86,5% com o TrofileTM. O presente projeto visou desenvolver modelos classificadores acurados, baseados em informações de sequências V3. Para isto, foram utilizadas 2.109 sequências de DNA da região V3 do HIV-1 de subtipo B. As sequências com os resultados do geno2pheno foram então modeladas pelos métodos de regressão logística, naive Bayes e random forest. Todos os classificadores apresentaram bons resultados preditivos, porém os modelos de random forest obtiveram o melhor desempenho discriminativo, sob a forma de resultados significativos de AUC. Tais resultados são encorajadores para a continuação do desenvolvimento de um algoritmo acurado e de uso prático para a predição clínica do tropismo viral, capaz de orientar a tomada de decisão em relação à utilização de antagonistas de correceptores no tratamento do HIV-1.Universidade Federal do Rio de JaneiroBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaPrograma de Pós-Graduação em Engenharia BiomédicaUFRJNobre, Flávio Fonsecahttp://lattes.cnpq.br/2953219280065235http://lattes.cnpq.br/907662689904722Almeida, Rosimary Terezinha deArruda, Monica BarcellosBarros, Cesar Borges2020-10-14T20:26:28Z2023-12-21T03:02:22Z2019-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/11422/13240porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJ2023-12-21T03:02:22Zoai:pantheon.ufrj.br:11422/13240Repositório InstitucionalPUBhttp://www.pantheon.ufrj.br/oai/requestpantheon@sibi.ufrj.bropendoar:2023-12-21T03:02:22Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false |
dc.title.none.fl_str_mv |
Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B |
title |
Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B |
spellingShingle |
Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B Barros, Cesar Borges HIV-1 subtipo B Tropismo viral Classificadores baseados em aprendizado de máquina CNPQ::ENGENHARIAS |
title_short |
Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B |
title_full |
Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B |
title_fullStr |
Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B |
title_full_unstemmed |
Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B |
title_sort |
Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B |
author |
Barros, Cesar Borges |
author_facet |
Barros, Cesar Borges |
author_role |
author |
dc.contributor.none.fl_str_mv |
Nobre, Flávio Fonseca http://lattes.cnpq.br/2953219280065235 http://lattes.cnpq.br/907662689904722 Almeida, Rosimary Terezinha de Arruda, Monica Barcellos |
dc.contributor.author.fl_str_mv |
Barros, Cesar Borges |
dc.subject.por.fl_str_mv |
HIV-1 subtipo B Tropismo viral Classificadores baseados em aprendizado de máquina CNPQ::ENGENHARIAS |
topic |
HIV-1 subtipo B Tropismo viral Classificadores baseados em aprendizado de máquina CNPQ::ENGENHARIAS |
description |
The development of coreceptor antagonists – such as maraviroc – for HIV treatment has made mandatory the clinical determination of viral coreceptor usage prior to rescue therapy. Technical issues presented by TrofileTM, the gold standard phenotypic assay, hindered its use as a routine diagnostic tool. This fact has lead to the development of genotypic algorithms, whose evaluations are based on DNA sequences of the V3 region of HIV-1 gp120. These algorithms proved to be cheaper, easier to use, and less time consuming than the phenotypic method. One of them, geno2pheno has also gained widespread use since it showed 86.5% predictive concordance with TrofileTM. The present project aimed to develop accurate classification models based on V3 sequence information. For this, 2,109 DNA sequences of V3 region from HIV-1 subtype B were used. Data labeled with geno2pheno’s results were then modeled by methods such as logistic regression, naive Bayes and random forest. All classifiers presented good predictive outputs, however random forest models showed the best discriminative performance, in the form of significant AUC results. These outcomes encourage us to continue the development of an easy to use and accurate algorithm for HIV-1 tropism diagnosis, capable of guiding clinical decision making regarding the use of coreceptor antagonists in HIV-1 treatment. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-03 2020-10-14T20:26:28Z 2023-12-21T03:02:22Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11422/13240 |
url |
http://hdl.handle.net/11422/13240 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia Biomédica UFRJ |
publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia Biomédica UFRJ |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRJ instname:Universidade Federal do Rio de Janeiro (UFRJ) instacron:UFRJ |
instname_str |
Universidade Federal do Rio de Janeiro (UFRJ) |
instacron_str |
UFRJ |
institution |
UFRJ |
reponame_str |
Repositório Institucional da UFRJ |
collection |
Repositório Institucional da UFRJ |
repository.name.fl_str_mv |
Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ) |
repository.mail.fl_str_mv |
pantheon@sibi.ufrj.br |
_version_ |
1815456010600448000 |