Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular

Detalhes bibliográficos
Autor(a) principal: Fabreti, Luiza Guimaraes [UNIFESP]
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UNIFESP
dARK ID: ark:/48912/001300000g4dz
Texto Completo: https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=8134321
https://repositorio.unifesp.br/handle/11600/59208
Resumo: The human immunodeficiency vírus (HIV) has a high genetic diversity due mostly to the lack of error repair mechanism of the viral reverse transcriptase combined with the quick replicative dynamics of the virus. These factors associated to the selective pressure of the environment contribute to a rapid evolution of the viral population within the host. To enter the cell, HIV uses both a cellular receptor (CD4) and a chemokine coreceptor. The most important coreceptors for the infection are CCR5 and CXCR4, the former being associated with the onset of infection and the second with late phase of infection. In the present study we have applied an unsupervised machine learning method known as principal component analysis (PCA) and the phylogenetic inference to estimate the genetic diversification of the population after a single replication cycle. To do this, the data from statistical inference have been used to estimate the probability of each nucleotide for each genome position of HIV, in different experimental conditions. PCA compared mutation patterns when infection occurs on CD4 T lymphocytes and peripheral blood mononuclear cells (PBMCs) in different (stimulated and non-stimulated) cell states and for the two viral types that utilize different coreceptors. In all cases, both PCA and phylogenetic tree produced clusters accordingly. This shows that after a single cycle of replication the populations presented differences of variability. It has also been observed that the genome positions that mutate are equally distributed throughout the genome, with an average range of 20 positions in the population analysis.
id UFSP_9ebe96816eb7a3fd2b84d51535cc627f
oai_identifier_str oai:repositorio.unifesp.br/:11600/59208
network_acronym_str UFSP
network_name_str Repositório Institucional da UNIFESP
repository_id_str 3465
spelling Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celularUnsupervised machine learning method applied to the study of single cycle spread of HIV in cellular culture.HIVInfecções Por HIVAnálise EstatísticaFilogeniaThe human immunodeficiency vírus (HIV) has a high genetic diversity due mostly to the lack of error repair mechanism of the viral reverse transcriptase combined with the quick replicative dynamics of the virus. These factors associated to the selective pressure of the environment contribute to a rapid evolution of the viral population within the host. To enter the cell, HIV uses both a cellular receptor (CD4) and a chemokine coreceptor. The most important coreceptors for the infection are CCR5 and CXCR4, the former being associated with the onset of infection and the second with late phase of infection. In the present study we have applied an unsupervised machine learning method known as principal component analysis (PCA) and the phylogenetic inference to estimate the genetic diversification of the population after a single replication cycle. To do this, the data from statistical inference have been used to estimate the probability of each nucleotide for each genome position of HIV, in different experimental conditions. PCA compared mutation patterns when infection occurs on CD4 T lymphocytes and peripheral blood mononuclear cells (PBMCs) in different (stimulated and non-stimulated) cell states and for the two viral types that utilize different coreceptors. In all cases, both PCA and phylogenetic tree produced clusters accordingly. This shows that after a single cycle of replication the populations presented differences of variability. It has also been observed that the genome positions that mutate are equally distributed throughout the genome, with an average range of 20 positions in the population analysis.O vírus da imunodeficiência humana (HIV, do inglês human immunodeficiency virus) possui uma alta diversidade genética devido, principalmente, à falta de mecanismo de reparo de erros da transcriptase reversa viral em conjunto com a dinâmica replicativa rápida do vírus. Esses fatores somados à pressão seletiva do ambiente contribuem para uma rápida evolução da população viral dentro de cada hospedeiro. Para entrar na célula, o HIV utiliza o receptor celular CD4 e um co-receptor de quimiocina, os coreceptores mais importantes para a infecção são o CCR5 e o CXCR4, sendo que o primeiro está associado ao início da infecção e o segundo à fase tardia da infecção. Nesta dissertação empregamos um método de aprendizado de máquina não supervisionado chamado análise de componentes principais, PCA (do inglês principal component analysis), e a inferência filogenética para estimar a diversificação genética populacional após um ciclo de replicação viral. Para isso, os dados de inferência estatística foram usados a fim de estimar a probabilidade de cada nucleotídeo para cada posição do genoma do HIV em diferentes condições experimentais após um ciclo único de replicação. O PCA foi usado para comparar os padrões de mutação quando a infecção ocorre em linfócitos T CD4 e células mononucleares do sangue periférico PBMC (do inglês peripheral blood mononuclear cells), em estados celulares diferentes (estimulado e não estimulado) e para os dois tipos virais que utilizam coreceptores diferentes. Em todos os casos, tanto PCA quanto filogenia produziram agrupamentos de forma concordante. Isto mostra que após um ciclo de replicação as populações apresentaram diferenças de variabilidade. Também foi observado que as posições do genoma que sofrem mutação são igualmente distribuídas ao longo do genoma, com um intervalo médio de 20 posições na análise das populações.Dados abertos - Sucupira - Teses e dissertações (2019)Universidade Federal de São Paulo (UNIFESP) Antoneli Junior, Fernando Martins [UNIFESP]Janini, Luiz Mário Ramos [UNIFESP]http://lattes.cnpq.br/5713863164263481http://lattes.cnpq.br/4503426222486154Universidade Federal de São Paulo (UNIFESP)Fabreti, Luiza Guimaraes [UNIFESP]2021-01-19T16:31:54Z2021-01-19T16:31:54Z2019-02-28info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersion86 f.application/pdfhttps://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=8134321FABRETI, Luiza Guimarães. Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular. 2019. 86f. Dissertação (Mestrado em Ciência Cirúrgica Infectologia) – Escola Paulista de Medicina, Universidade Federal de São Paulo. São Paulo, 2019.Luiza Guimarães Fabreti-A.pdfhttps://repositorio.unifesp.br/handle/11600/59208ark:/48912/001300000g4dzporinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESP2024-08-02T23:39:17Zoai:repositorio.unifesp.br/:11600/59208Repositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652024-12-11T20:16:21.571784Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)false
dc.title.none.fl_str_mv Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular
Unsupervised machine learning method applied to the study of single cycle spread of HIV in cellular culture.
title Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular
spellingShingle Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular
Fabreti, Luiza Guimaraes [UNIFESP]
HIV
Infecções Por HIV
Análise Estatística
Filogenia
title_short Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular
title_full Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular
title_fullStr Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular
title_full_unstemmed Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular
title_sort Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular
author Fabreti, Luiza Guimaraes [UNIFESP]
author_facet Fabreti, Luiza Guimaraes [UNIFESP]
author_role author
dc.contributor.none.fl_str_mv Antoneli Junior, Fernando Martins [UNIFESP]
Janini, Luiz Mário Ramos [UNIFESP]
http://lattes.cnpq.br/5713863164263481
http://lattes.cnpq.br/4503426222486154
Universidade Federal de São Paulo (UNIFESP)
dc.contributor.author.fl_str_mv Fabreti, Luiza Guimaraes [UNIFESP]
dc.subject.por.fl_str_mv HIV
Infecções Por HIV
Análise Estatística
Filogenia
topic HIV
Infecções Por HIV
Análise Estatística
Filogenia
description The human immunodeficiency vírus (HIV) has a high genetic diversity due mostly to the lack of error repair mechanism of the viral reverse transcriptase combined with the quick replicative dynamics of the virus. These factors associated to the selective pressure of the environment contribute to a rapid evolution of the viral population within the host. To enter the cell, HIV uses both a cellular receptor (CD4) and a chemokine coreceptor. The most important coreceptors for the infection are CCR5 and CXCR4, the former being associated with the onset of infection and the second with late phase of infection. In the present study we have applied an unsupervised machine learning method known as principal component analysis (PCA) and the phylogenetic inference to estimate the genetic diversification of the population after a single replication cycle. To do this, the data from statistical inference have been used to estimate the probability of each nucleotide for each genome position of HIV, in different experimental conditions. PCA compared mutation patterns when infection occurs on CD4 T lymphocytes and peripheral blood mononuclear cells (PBMCs) in different (stimulated and non-stimulated) cell states and for the two viral types that utilize different coreceptors. In all cases, both PCA and phylogenetic tree produced clusters accordingly. This shows that after a single cycle of replication the populations presented differences of variability. It has also been observed that the genome positions that mutate are equally distributed throughout the genome, with an average range of 20 positions in the population analysis.
publishDate 2019
dc.date.none.fl_str_mv 2019-02-28
2021-01-19T16:31:54Z
2021-01-19T16:31:54Z
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=8134321
FABRETI, Luiza Guimarães. Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular. 2019. 86f. Dissertação (Mestrado em Ciência Cirúrgica Infectologia) – Escola Paulista de Medicina, Universidade Federal de São Paulo. São Paulo, 2019.
Luiza Guimarães Fabreti-A.pdf
https://repositorio.unifesp.br/handle/11600/59208
dc.identifier.dark.fl_str_mv ark:/48912/001300000g4dz
url https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=8134321
https://repositorio.unifesp.br/handle/11600/59208
identifier_str_mv FABRETI, Luiza Guimarães. Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular. 2019. 86f. Dissertação (Mestrado em Ciência Cirúrgica Infectologia) – Escola Paulista de Medicina, Universidade Federal de São Paulo. São Paulo, 2019.
Luiza Guimarães Fabreti-A.pdf
ark:/48912/001300000g4dz
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 86 f.
application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Paulo (UNIFESP)
publisher.none.fl_str_mv Universidade Federal de São Paulo (UNIFESP)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNIFESP
instname:Universidade Federal de São Paulo (UNIFESP)
instacron:UNIFESP
instname_str Universidade Federal de São Paulo (UNIFESP)
instacron_str UNIFESP
institution UNIFESP
reponame_str Repositório Institucional da UNIFESP
collection Repositório Institucional da UNIFESP
repository.name.fl_str_mv Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)
repository.mail.fl_str_mv biblioteca.csp@unifesp.br
_version_ 1818602459453456384