Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UNIFESP |
dARK ID: | ark:/48912/001300000g4dz |
Texto Completo: | https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=8134321 https://repositorio.unifesp.br/handle/11600/59208 |
Resumo: | The human immunodeficiency vírus (HIV) has a high genetic diversity due mostly to the lack of error repair mechanism of the viral reverse transcriptase combined with the quick replicative dynamics of the virus. These factors associated to the selective pressure of the environment contribute to a rapid evolution of the viral population within the host. To enter the cell, HIV uses both a cellular receptor (CD4) and a chemokine coreceptor. The most important coreceptors for the infection are CCR5 and CXCR4, the former being associated with the onset of infection and the second with late phase of infection. In the present study we have applied an unsupervised machine learning method known as principal component analysis (PCA) and the phylogenetic inference to estimate the genetic diversification of the population after a single replication cycle. To do this, the data from statistical inference have been used to estimate the probability of each nucleotide for each genome position of HIV, in different experimental conditions. PCA compared mutation patterns when infection occurs on CD4 T lymphocytes and peripheral blood mononuclear cells (PBMCs) in different (stimulated and non-stimulated) cell states and for the two viral types that utilize different coreceptors. In all cases, both PCA and phylogenetic tree produced clusters accordingly. This shows that after a single cycle of replication the populations presented differences of variability. It has also been observed that the genome positions that mutate are equally distributed throughout the genome, with an average range of 20 positions in the population analysis. |
id |
UFSP_9ebe96816eb7a3fd2b84d51535cc627f |
---|---|
oai_identifier_str |
oai:repositorio.unifesp.br/:11600/59208 |
network_acronym_str |
UFSP |
network_name_str |
Repositório Institucional da UNIFESP |
repository_id_str |
3465 |
spelling |
Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celularUnsupervised machine learning method applied to the study of single cycle spread of HIV in cellular culture.HIVInfecções Por HIVAnálise EstatísticaFilogeniaThe human immunodeficiency vírus (HIV) has a high genetic diversity due mostly to the lack of error repair mechanism of the viral reverse transcriptase combined with the quick replicative dynamics of the virus. These factors associated to the selective pressure of the environment contribute to a rapid evolution of the viral population within the host. To enter the cell, HIV uses both a cellular receptor (CD4) and a chemokine coreceptor. The most important coreceptors for the infection are CCR5 and CXCR4, the former being associated with the onset of infection and the second with late phase of infection. In the present study we have applied an unsupervised machine learning method known as principal component analysis (PCA) and the phylogenetic inference to estimate the genetic diversification of the population after a single replication cycle. To do this, the data from statistical inference have been used to estimate the probability of each nucleotide for each genome position of HIV, in different experimental conditions. PCA compared mutation patterns when infection occurs on CD4 T lymphocytes and peripheral blood mononuclear cells (PBMCs) in different (stimulated and non-stimulated) cell states and for the two viral types that utilize different coreceptors. In all cases, both PCA and phylogenetic tree produced clusters accordingly. This shows that after a single cycle of replication the populations presented differences of variability. It has also been observed that the genome positions that mutate are equally distributed throughout the genome, with an average range of 20 positions in the population analysis.O vírus da imunodeficiência humana (HIV, do inglês human immunodeficiency virus) possui uma alta diversidade genética devido, principalmente, à falta de mecanismo de reparo de erros da transcriptase reversa viral em conjunto com a dinâmica replicativa rápida do vírus. Esses fatores somados à pressão seletiva do ambiente contribuem para uma rápida evolução da população viral dentro de cada hospedeiro. Para entrar na célula, o HIV utiliza o receptor celular CD4 e um co-receptor de quimiocina, os coreceptores mais importantes para a infecção são o CCR5 e o CXCR4, sendo que o primeiro está associado ao início da infecção e o segundo à fase tardia da infecção. Nesta dissertação empregamos um método de aprendizado de máquina não supervisionado chamado análise de componentes principais, PCA (do inglês principal component analysis), e a inferência filogenética para estimar a diversificação genética populacional após um ciclo de replicação viral. Para isso, os dados de inferência estatística foram usados a fim de estimar a probabilidade de cada nucleotídeo para cada posição do genoma do HIV em diferentes condições experimentais após um ciclo único de replicação. O PCA foi usado para comparar os padrões de mutação quando a infecção ocorre em linfócitos T CD4 e células mononucleares do sangue periférico PBMC (do inglês peripheral blood mononuclear cells), em estados celulares diferentes (estimulado e não estimulado) e para os dois tipos virais que utilizam coreceptores diferentes. Em todos os casos, tanto PCA quanto filogenia produziram agrupamentos de forma concordante. Isto mostra que após um ciclo de replicação as populações apresentaram diferenças de variabilidade. Também foi observado que as posições do genoma que sofrem mutação são igualmente distribuídas ao longo do genoma, com um intervalo médio de 20 posições na análise das populações.Dados abertos - Sucupira - Teses e dissertações (2019)Universidade Federal de São Paulo (UNIFESP) Antoneli Junior, Fernando Martins [UNIFESP]Janini, Luiz Mário Ramos [UNIFESP]http://lattes.cnpq.br/5713863164263481http://lattes.cnpq.br/4503426222486154Universidade Federal de São Paulo (UNIFESP)Fabreti, Luiza Guimaraes [UNIFESP]2021-01-19T16:31:54Z2021-01-19T16:31:54Z2019-02-28info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersion86 f.application/pdfhttps://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=8134321FABRETI, Luiza Guimarães. Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular. 2019. 86f. Dissertação (Mestrado em Ciência Cirúrgica Infectologia) – Escola Paulista de Medicina, Universidade Federal de São Paulo. São Paulo, 2019.Luiza Guimarães Fabreti-A.pdfhttps://repositorio.unifesp.br/handle/11600/59208ark:/48912/001300000g4dzporinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESP2024-08-02T23:39:17Zoai:repositorio.unifesp.br/:11600/59208Repositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652024-12-11T20:16:21.571784Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)false |
dc.title.none.fl_str_mv |
Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular Unsupervised machine learning method applied to the study of single cycle spread of HIV in cellular culture. |
title |
Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular |
spellingShingle |
Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular Fabreti, Luiza Guimaraes [UNIFESP] HIV Infecções Por HIV Análise Estatística Filogenia |
title_short |
Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular |
title_full |
Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular |
title_fullStr |
Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular |
title_full_unstemmed |
Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular |
title_sort |
Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular |
author |
Fabreti, Luiza Guimaraes [UNIFESP] |
author_facet |
Fabreti, Luiza Guimaraes [UNIFESP] |
author_role |
author |
dc.contributor.none.fl_str_mv |
Antoneli Junior, Fernando Martins [UNIFESP] Janini, Luiz Mário Ramos [UNIFESP] http://lattes.cnpq.br/5713863164263481 http://lattes.cnpq.br/4503426222486154 Universidade Federal de São Paulo (UNIFESP) |
dc.contributor.author.fl_str_mv |
Fabreti, Luiza Guimaraes [UNIFESP] |
dc.subject.por.fl_str_mv |
HIV Infecções Por HIV Análise Estatística Filogenia |
topic |
HIV Infecções Por HIV Análise Estatística Filogenia |
description |
The human immunodeficiency vírus (HIV) has a high genetic diversity due mostly to the lack of error repair mechanism of the viral reverse transcriptase combined with the quick replicative dynamics of the virus. These factors associated to the selective pressure of the environment contribute to a rapid evolution of the viral population within the host. To enter the cell, HIV uses both a cellular receptor (CD4) and a chemokine coreceptor. The most important coreceptors for the infection are CCR5 and CXCR4, the former being associated with the onset of infection and the second with late phase of infection. In the present study we have applied an unsupervised machine learning method known as principal component analysis (PCA) and the phylogenetic inference to estimate the genetic diversification of the population after a single replication cycle. To do this, the data from statistical inference have been used to estimate the probability of each nucleotide for each genome position of HIV, in different experimental conditions. PCA compared mutation patterns when infection occurs on CD4 T lymphocytes and peripheral blood mononuclear cells (PBMCs) in different (stimulated and non-stimulated) cell states and for the two viral types that utilize different coreceptors. In all cases, both PCA and phylogenetic tree produced clusters accordingly. This shows that after a single cycle of replication the populations presented differences of variability. It has also been observed that the genome positions that mutate are equally distributed throughout the genome, with an average range of 20 positions in the population analysis. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-02-28 2021-01-19T16:31:54Z 2021-01-19T16:31:54Z |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=8134321 FABRETI, Luiza Guimarães. Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular. 2019. 86f. Dissertação (Mestrado em Ciência Cirúrgica Infectologia) – Escola Paulista de Medicina, Universidade Federal de São Paulo. São Paulo, 2019. Luiza Guimarães Fabreti-A.pdf https://repositorio.unifesp.br/handle/11600/59208 |
dc.identifier.dark.fl_str_mv |
ark:/48912/001300000g4dz |
url |
https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=8134321 https://repositorio.unifesp.br/handle/11600/59208 |
identifier_str_mv |
FABRETI, Luiza Guimarães. Método de aprendizado de máquina não supervisionado aplicado ao estudo da propagação de ciclo único do HIV em cultivo celular. 2019. 86f. Dissertação (Mestrado em Ciência Cirúrgica Infectologia) – Escola Paulista de Medicina, Universidade Federal de São Paulo. São Paulo, 2019. Luiza Guimarães Fabreti-A.pdf ark:/48912/001300000g4dz |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
86 f. application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Paulo (UNIFESP) |
publisher.none.fl_str_mv |
Universidade Federal de São Paulo (UNIFESP) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNIFESP instname:Universidade Federal de São Paulo (UNIFESP) instacron:UNIFESP |
instname_str |
Universidade Federal de São Paulo (UNIFESP) |
instacron_str |
UNIFESP |
institution |
UNIFESP |
reponame_str |
Repositório Institucional da UNIFESP |
collection |
Repositório Institucional da UNIFESP |
repository.name.fl_str_mv |
Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP) |
repository.mail.fl_str_mv |
biblioteca.csp@unifesp.br |
_version_ |
1818602459453456384 |